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GLUTAMINE:FRUCTOSE-6-PHOSPHATE AMIDOTRANSFERASE (GFAT) 
COMPRENANT UNE ETIQUETTE DE PURIFICATION INTERNE, ET SON 
UTILISATION POUR LE CRIBLAGE DE COMPOSES 

La pr6sente invention concerne une glutamine:fructose-6-phosphate 
anudolransferase modify, purifiable rapidement et en quantity suffisantes pour le 
criblage de composes modifiant son activity. 

Les glutamine:fructose-6-phosphate amidotransferases (GFAT), EC 2.6.1.16, 
egalement appelees glucosamine-6-phosphate synthases ou 2-deoxy-glucose-6- 
phosphate cetol isomerases, sont impliqudes dans la voie de biosynthese des 
hexosamines. La GFAT catalyse la premiere etape, Umitante, de cette voie de 
biosynthese selon la reaction : 

L-Glutamine + fructose-6-phosphate ► L-Glutamate + glucosamine-6-phosphate 

par transfert de 1' azote amidique de la L-Glutamine sur la fonction cetone du fructose-6- 
phosphate. Les GFAT contrSlent done le flux de glucose dans la voie des hexosamines, 
via le finictose-6-phosphate, et par consequent la formation des hexosamines produites. 

Une forme bacterienne recombinante de la GFAT, la glucosamine-6-phosphate 
synthase d'Escherichia coli, a et6 purifiee a homogeneity et etudiee de facon 
exhaustive. Les proprietes et le mecanisme enzymatique du transfert de l'amide ont 
notamment ete largement decrits (pour revue Teplyakov et al, Nat Prod. Rep. (2002) 
19:60). En particulier, cette enzyme, dont la structure cristalline a ete resolue ' 
(Teplyakov et al, J. Mol Biol. (2001) 313:1093), est fonnee de deux domaines, Tun 
ayant une activity hydrolase (glutaminase) et l'autre une activity isomerase. 

Par ailleurs, des GFAT d'eucaryotes ont 6te caracteris6es, dont notamment celle 
de foie de rat (Huyrih et al, Arch. Biochem. Biophys. (2000) 379:307) et celle de la 
levure Candida albicans (Milewsky et al, J. Biol. Chem. (1999) 274:4000). 

Chez l'homme, des etudes pr61iminaires ont montre la presence d'une activity 
GFAT dans le foie (Ghosh et al, J. Biol Chem. (I960) 235:1265). Plusieurs GFAT sont 
dysormais connues. GFATl, la forme principale, GFAT2, qui est exprimye 
prefyrentiellement dans le systeme nerveux central, et . GFATl Alt, une isoforme de 
GFATl, exprimye essentiellement dans les muscles stries. Les syquences peptidiques de 
GFATl et GFAT2 possMent 75% d'identitys de syquences entre elles, et celles de 
GFATl et GFATlAlt sont identiques excepty pour une insertion de 18 acides amines 
dans la sequence de GFATlAlt. Les syquences de GFAT sont done tres conservees chez 
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l'hormne, mais egalement entre les especes, puisque les sequences peptidiques de la 
GFAT1 humaine et de la GFAT d'* coli ou de la GFAT1 de souris pr6se„tent 
respectivement 35% et 99% d'identit6s. 

Le gene de la GFAT1 humaine a *6 clone en 1992 (McKnight et aL, J. Biol 
Chem. (1992) 267:25208). H code une proteine de 77 kDa form6e de deux domaines 
distorts (Teplyakov et al, Nat. Prod. Rep. (2002) 19:60). 

^augmentation de la production de l'UDP-NAc-GlcNH 2 , le produit final de la 
vo ie de biosynthese des hexosamines, et son accumulation dans les tissus ont 
recemment et6 impliquees dans le developpement de la resistance a 1'insuline (Marshall 
et al, FASEB J. (1991) 5:3031, Yki-Jarvinen et al, Diabetes (1996) 45:302, Thompson 
et al, J. Biol Chem. (1997) 272: 7759, Hawkins et al, J. Clin. Invest. (1997) 99-2173 • 
Robmson et al, Diabetes (1993) 42:1333, Daniels et al, J. Clin. Invest. (1995) 96:1235^ 
Baron et al, J. Clin. Invest. (1995) 96:2792). 

Ainsi, il a ete montre qu'une augmentation du niveau cellulaire d'UDP-NAc- 
GlcNH 2 par une modeste suppression de GFAT1, ou un apport de glucosamine 
exogene, pent induire une resistance a 1'insuline a la fois in vivo et dans des adipocytes 
en culture (Robinson et al, Diabetes (1993) 42:1333, Daniels et al, J. Clin. Invest 
(1995) 96:1235, Baron et al, J. Clin. Invest (1995) 96:2792, Hebert et al, J Clin 
Invest. (1996) 98:930). 

En effet, Pi^uline ^ sa Toie de tswiae6m gu gg fixant h son recepteur ce 
qm rndui, la translocation das transports da glucose, tals que le reoepteur.GLUT4 
stockes dana la celWe, vers la membrane, et augmente Pafflux de glucoae. Le glucose 
entre ainsi dana la voie de la glycolysa et est convert! en gIncose-6-phosphate puis en 
ftuctose-6-phoaphate. Loraque Eafflux de glucose eat exceaaif ,e frtctose-6-phoaphate 
entre dans la voie de biosynthese des hexosanunes et eat convert en glucosanrine-6- 
Phosphate par la OFAT. Pluaieurs observations indiquent que lea me.abo.itea de la 
glucoaamine-6-phoaphate empSchent la translocation des recepteura an glucose vers la 
membrane cellulaire, diminnan, ainsi 1'afflux du glucoae cellulaire (Marshall et al 
FASEB J. (1991) 5:3031, Giacarriar al, Diaoetologia (199S, 38:5 18, Marshall etal J 
Biol. Chem. (1991) 266:4706, Paterson et al, Endocrinology (1995) 136-2809) 

Le mecaniame par lequel les metabolites de la glucosamine-6-phoapha.e exercent 
leura effets physiologies n'es. paa elair. Une hypothec a cependant « propos6e • 
nne concenttation cytosolique elevee. dW-NAc-GlcNH, entratoerai« 
i hyperglycoaylation des aites de phosphorylation Ser ou Thr, conduisant oe la sorte a 
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l'arret de lavoie de signalisation de l'insuline (Comer, et al, J, Biol. Chem. (2000) 
275:29179). 

L' activite GFAT est done consid6r6e comme etant Tune des causes des hauts 
niveaux de glucose sanguin ; par ailleurs elle est connue pour Stre elevee chez les 
patients atteints de diabete sucr6 non-insulino d6pendant ou diabete de type n (Yki- 
Jarvinen et al. t Diabetes (1996) 45:302). 

L'obtention d'inhibiteurs de la GFAT permettrait d'abaisser la glycemie en 
particulier chez les individus atteints de pathologies liees a une hyperglycemic, telles 
que le diabete de type n, l'acidose et/ou la c6tose diabetique, par exemple. 

Des inhibiteurs de la GFAT de plante ou de champignon pourraient egalement 
permettre d'obtenir respectivement des fongicides et des herbicides. 

Toutefois, malgre l'obtention de formes recombinantes de GFAT, l'instabilite des 
preparations enzymatiques obtenues, leur faible quantite, et leur niveau de purification 
insuffisant, n'ontpas permis d'obtenir des inhibiteurs efficaces de GFAT. 

Un objet de l'invention est done de fournir une GFAT modifiee dont Tactivite est 
stable et pouvant etre obtenue en grande quantite, avec un haut niveau de puret£ et 
d'activite. 

La pr&ente invention concerne une proteine enzymatiquement active 
comprenant : . • ' 

- une sequence de GFAT et au moins une sequence d'une etiquette de 
purification, la sequence de l'6tiquette de purification 6tant inser6e entre deux, 
acide amines. cons6cutifs de la sequence de GFAT, ou 

- une sequence derivant de la sequence precedente par suppression, insertion ou 
mutation d'au moins un acide amine, sous reserve que ladite proteine pr6sente 
une activite enzymatique, ou 

- une sequence presentant au moins 35 %, notamment au moins 90 %, d'identite 
de sequence et/ou au moins 44 %, notamment au moins 95 %, de similarite de 
sequence avec 1'une des sequences precedentes, sous reserve que ladite proteine 
presente une activite enzymatique. 

On designe par GFAT une enzyme de la classe E.C. 2.6.1.16 catalysant la reaction 
suivante: 

L-Glutamine + fructose-6-phosphate ► L-Giutamate + glucosamine-6-phosphate 

notamment dans les conditions experimentales telles qu'elles sont decrites dans 
1* exemple qui suit ou dans Broschat et al„J. Biol. Chem. (2002) 277:14764. 
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GFAT est d6signee sous le nom de glutarrrine:fructose-6-phosphate 
amidotransferase, ou egalement glucosamine-6-phosphate synthase ou 2-deoxy-glucose- 
6-phosphate c6tol isomerase. 

On designe par « proteine enzymatiquement active » une proteine ayant une 
action catalytique. 

Avantageusement, la proteine enzymatiquement active possede une activit6 
GFAT. 

On d6signe par « etiquette de purification » une sequence peptidique susceptible 
de se lier sp6cifiquement a un ligand donn6. Avantageusement la liaison dudit ligand a 
l'6tiquette de purification permet de former un complexe entre la proteine portant 
l'etiquette de purification et ledit Ugand, ledit complexe pouvant etre sp6cifiquement 
isole. 

Avantageusement les etiquettes de purification selon l'invention ne sont pas 
placees en bout de chaine peptidique, a l'extremite N-terminale ou C-terminale, mais a 
15 rinterieur de la chaine peptidique. 

On designe par « identitS de sequence » le pourcentage d'acides amines identiques 
entre deux s6quences alignees, notamment a l'aide d'algorithmes tels que celui defini 
par Altschul et al y Nucleic Acids Res. (1997) 25:3389, par exemple. 

On designe par «similarite de sequence » le pourcentage d'acides amines 
sirmlaires, c'est-a-dire d'acides amin6s dont les chaines lat6rales possedent des 
propriety physico-chhniques proches, entre deux sequence alignees, notamment k 
l'aide d'algorithmes tels que celui defini par Altschul et al> Nucleic Acids Res. (1997) 
25:3389, par exemple. 

La presente invention concerne en particulier une proline telle que definie ci- 
dessus, dans laquelle la sequence de GFAT correspond a une s6quence de GFAT de 
bacterie ou d'eucaryote, notamment de plante, de champignon ou d'animal, en 
particuUer d'insecte ou de mammifere, plus particulierement d'homme. 

L'invention concerne plus particulierement une proteine telle que d6fmie ci- 
dessus, dans laquelle la s6quence de l'6tiquette de purification est inseree entre deux 
acides amines cons6cutifs de la sequence de GFAT, lesdits acides amin6s etant compris 
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dans 



- une partie de la sequence de la GFAT correspondant a la sequence s'etendant 
entre le feuillet ^2 et le feuillet ^3 de la GFAT d' Escherichia coli, ou 
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- une partie de la s6quence de la GFAT correspondant a la sequence s'6tendant 
entre le feuijlet 013 et le feuillet 014 de la GFAT d' Escherichia coli, ou 

- une partie de la sequence de la GFAT correspondant a la sequence s'etendant 
entre le feuillet 015 et l'h61ice os6 de la GFAT d'Escherichia colt 

La structure de la GFAT d'Escherichia coli est decrite en particulier par 
Teplyakov et al, J. Mol Biol (2001) 313:1093 (prot6ine entiere), par Isupov et al 
Structure (1996) 4:801 (domaine glutaminase) et par Teplyakov et al, Structure (1998) 
6:1047 (domaine isomerase). La structure de la proteine complete est notamment 
consultable a 1* aide du fichier de coordonnees atomiques 1JXA depos6 aupres de la 
Protein Data Bank (http://www.pdb.org). 

La sequence peptidique de la GFAT d'E. coli est definie par SEQ ID NO : 13. 

La sequence s'etendant entre le feuillet /32 et le feuillet 03 correspond a la 
s6quence s'6tendant approximativement entre les acides amin6s 30 a 80 de la GFAT 
d'E. coli, situes dans le domaine glutaminase. 

La sequence s'etendant entre le feuillet 013 et le feuillet 014 correspond a la 
sequence s'etendant approximativement entre les acides amines 220 a 230 de la GFAT 
d'E. coli, situ6s dans le domaine glutaminase. 

La sequence s'etendant entre le feuillet 015 et l'helice a6 correspond a la 
sequence s'etendant approximativement entre les acides amin6s 235 a 250 de la GFAT 
d'E. coli, situes dans le domaine isomerase. 

^identification des parties de sequences d'une GFAT correspondant a des 
structures secondaires de la GFAT d'E. coli pent etre obtenue en alignant la sequence de 
ladite GFAT avec celle de la GFAT d'E, coli, notamment a 1'aide d'un algorithme tel 
que celui defini par Altschul et al, Nucleic Acids Res. (1997) 25:3389, par exemple. 

L'invention conceme notamment une proteine ci-dessus, dans laquelle la 
sequence de GFAT correspond a : 

- SEQ ID NO : 2, correspondant a la sequence de la GFAT1 humaine, 

- SEQ ID NO : 4, correspondant a la sequence de la GFAT2 humaine, 

- SEQ ID NO : 6, correspondant a la sequence de la GFAT1 Alt humaine. 

La sequence de la GFAT1 humaine est notamment decrite dans McKnight et al 
J. Biol. Chem. (1992) 267:25208, et correspond a la sequence nucleotidique SEQ ID 
NO : 1. . . 

La sequence de la GFAT2 humaine est notamment decrite dans Oki et al 
Genomics (1999) 57:227, et correspond a la sequence nucleotidique SEQ ID NO : 3. 
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La sequence de la GFATlAlt humaine est notamment decrite dans DeHaven et 
al, Diabetes (2001) 50:2419, et correspond a la s6quence nucleotidique SEQ ID NO : 5. 

L'invention conceme en particulier une proline ci-dessus, dans laquelle la 
sequence de Etiquette de purification est inser6e entre deux acides amines consecutifs, 
lesdits acides amines 6tant compris entre les acides amines : 

- 43 a 47, 298 a 306, et/ou 342 a 347 de SEQ ID NO : 2, 

- 42 a 45, 299 a 307, et/ou 343 a 348 de SEQ ID NO : 4 

- 43 a 47, 316 a 324, et/ou 360 a 365 de SEQ ID NO : 6 
Les acides amines 43 a 47 de SEQ ID NO : 2, 42 a 45 de SEQ ID NO : 4 et 43 a 

47 de SEQ ID NO : 6 correspondent a la partie de la sequence de la GFAT d'K coli 
s'etendant entre le feuillet jS2 et le feuillet 03. 

Les acides amines 298 a 306 de SEQ ID NO : 2, 299 a 307 de SEQ ID NO : 4 et 
325 a 330 de SEQ ID NO : 6 correspondent a la partie de la sequence de la GFAT d'£ 
coli s'&endant entre le feuillet 013 et le feuillet 014. 

Les acides amin6s 342 a- 347 de SEQ ID NO : 2, 343 a 348 de SEQ ID NO : 4 et 
360 a 365 de SEQ ID NO : 6 correspondent a la partie de la sdquence de la GFAT d'E. 
coli s'6tendant entre le feuillet 015 et l'helice a6. 

L'invention concerne plus particulierement une proteine ci-dessus, dans laquelle 
la sequence de l'etiquette de purification est inseree entre les acides amines : 
20 -299et300deSEQIDNO:2, 

- 300 et 301 de SEQ ID NO : 4, 

- 317 et 318 de SEQ ID NO : 6. 

L'invention concerne notamment une proteine ci-dessus, dans laquelle l'etiquette 
de purification correspond a une sequence d'environ 2 a environ 10 acides amines, 
notamment d'environ 4 a environ 8 acides amines. ' 

Des 6tiquettes de purification preferees selon l'invention concerned notamment 
des etiquettes dites FLAG (Sigma-Aldrich, France). Ces etiquettes se lient 
specxfiquement a un paratope donn6, ledit paratope pouvant appartenir a un anticorps ou 
a un fragment d'anticorps par exemple. Un exemple particulier d'etiquette FLAG est 
constitue par la sequence peptidique Asp-Tyr-Lys-Asp-Asp-Asp-Asp-Asp-Lys (SEQ ID 
NO : 18) par exemple. 

D'autres etiquettes pr6ferees selon Invention sont des etiquettes formees de 
plusieurs histidines. Ces etiquettes peuvent former des complexes avec des cations 
metalliques divalents tels que Ni 2+ ou Co 2+ par exemple. 



25 



30 



1 er depot 
7 

V invention concerne en particulier une prot6ine telle que definie ci-dessus, dans 
laquelle l'6tiquette de purification est une hexa-histidine. 

On designe par hexa-histdine la sequence His-His-His-His-His-His (SEQ ID NO : 

19). 

L'invention concerne plus particulierement une proteine telle que definie ci- 
dessus correspondant aux s6quences : 

- SEQ ID NO : 8, correspondant a la sequence SEQ ID NO : 2 dans laquelle une 
hexa-histidine est inseree entre les acides amines 299 et 300, 

- SEQ ID NO : 10, correspondant a la sequence SEQ ED NO : 4 dans laquelle une 
hexa-histidine est inseree entre les acides amines 300 et 301, et 

- SEQ ID NO : 12, correspondant a la sequence SEQ ID NO : 6 dans laquelle une 
hexa-histidine est inseree entre les acides amines 317 et 318. 

La presente invention concerne 6galement un acide nucleique comprenant ou etant 
constituS d'une sequence codant pour une proteine telle que dSfinie ci-dessus. 

L'invention concerne plus particulierement un acide nucleique comprenant ou 
6tant constitue de la sequence nucl6otidique : 

- SEQ ID NO : 7 codant pour la prot6ine SEQ ID NO : 8, ou 

- SEQ ID NO : 9 codant pour la proteine SEQ ID NO : 1 0, ou 

- SEQ ID NO : 1 1 codant pour la proteine SEQ ID NO : 12, 

ou de son complementaire, ou etant derive de ladite sequence par mutation, insertion ou 
deletion d'au moins un nucleotide, sous r6serve que ladite sequence nucleotidique code 
pour une prot6ine enzymatiquement active. 

Selon un autre mode de realisation, la presente invention concerne egalement un 
vecteur eucaryote ou procaryote comprenant un acide nucl&que tel que defied ci-dessus. 

Ces vecteurs permettent notamment de synthetiser les proteines selon l'invention 
dans un organisme eucaryote ou procaryote. 

Avantageusement l'invention concerne un vecteur d'expression de type 
baculovirus permettant la synthase des proteines selon l'invention dans des cellules 
d'insecte. 

La presente invention concerne egalement un procedS de purification d'une 
proteine telle que definie ci-dessus, a partir- d'une solution comprenant ladite proteine, 
comprenant une etape de mise en presence de ladite solution avec un compose se liant 
specifiquement 4 l'etiquette de purification de ladite prot6ine et une etape de separation 
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du complexe form6 par la liaison de ladite proline audit compos6 des autres 
constituants de la solution. 

Le compose peut Stre fix6 sur un support solide de sorte que le complexe fonn6 
entre ledit compose et ladite proteine peut 6tre r6cup6r6 par centrifugation ou filtration. 
Optionnellement ledit compose fix6 sur son support peut §tre disposd dans une .colonne 
a travers laquelle ladite solution est elu£e. 

Avantageusement, le proced6 ci-dessus peut egalement comprendre une etape de 
dissociation du complexe forme par la liaison de ladite proteine audit compost afin de 
r6cup6rer la proteine purifiee. 

L'invention conceme plus particulidrement un proc£d6 de purification tel que 
dSfini ci-dessus, comprenant une 6tape de mise en presence d'une solution comprenant 
une proteine telle que ddfinie ci-dessus avec un compos6 comprenant un cation 
metallique divalent tel que Ni 2+ ou Co 2+ , notamment Ni 2+ , et une 6tape de separation du 
complexe forme par la liaison de la proteine audit compost des autres constituants de la 
solution. 

Avantageusement, le precede ci-dessus peut Sgalement comprendre une etape de 
dissociation du complexe form6 par la liaison de ladite proteine audit compost 
comprenant un cation metallique divalent, notamment k l'aide d'imidazole, afin de 
recup6rer la proteine purifiee. 

Selon un autre mode de realisation la pr6sente invention conceme un proc&ie de 
conservation d'une proteine telle que definie ci-dessus sous une forme 
enzymatiquement active, notamment k -80°C ou k 4°C, comprenant l'adjonction de 
ladite proteine a une solution comprenant : 

- d'environ I mM a environ 10 mM de fructose 6-phosph^te, notamment environ 
1 mM, 

- d'environ 1 mM k environ 5 mM de Tris(2-.carboxyethyl)phosphine, 
notamment environ 1 mM, 

- d'environ 5 % a environ 20 % de glycerol, notamment environ 10%. 
Le fiructose-6-phosphate est un substrat de ladite proteine. 

Le Tris(2-carboxyethyl)phosphine est un compose rdducteur permettant 
avantageusement de maintenir les propriety de resines portant des ions Ni 2+ ou Co 2+ . 
Avantageusement le glycerol est un agent cryoprotectant, 

i 

A ce titre la presente invention conceme 6galement une composition comprenant 
une proteine GFAT active, le cas echeant U6e a une etiquette de purification, telle 
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qu'une proteine telle que definie ci-dessus, ladite proline 6tant susceptible de pouvoir 
Stre conserv6e sous une forme enzymatiquement active, durant au moins 8 jours k une 
temp6rature de 2°C k 10°C, notamment environ 4°C, et duraat au moins 12 mois k une 
temp6rature de -100°C k -20°C, notamment environ -80°C, ladite proline etant en 
association avec ; 

• environ 1 mM k environ 10 mM de fructose 6-phosphate, notamment environ 1 
mM, 

- environ 1 mM a environ 5 mM de Tris(2-carboxyethyl)phosphine, notamment 
environ 1 mM, 

- environ 5 % k environ 20 % de glycerol, notamment environ 10%. 

La pr£sente invention conceme egalement Tutilisation d'une proteine telle que 
definie ci-dessus, pour le criblage de composes modifiant l'activite de ladite proteine, 
en particulier pour le criblage d'inhibiteur de ladite proline. 

L'activite des proteines selon l'invention peut etre en particulier mesur6e a F aide 
des m&hodes suivantes : 

- la methode radiometrique decrite par Broschat et aL, Analytical Biochem. (2002) 
305:10-15, 

- la methode dite au Nitro Bleu Tetrazolium decrite par Nakata et aL, J. Antibio. 
(2001)54:737-743. 

- la methode Morgan-Elson d6crite par Ghosh et aL, Method. Enzymol. (1960) 
5:414 et d6taill6e dans Texemple qui suit. 

- la methode APAD decrite par Badet et aL, Biochemistry (1987) 26:1940 et 
detaillee dans Fexemple qui suit. 

Avantageusement ces methodes peuvent etre utilisees pour le criblage, notamment 
k haut debit, de composes modifiant Pactivit6 des prolines selon l'invention. 

L'invention conceme en particulier I'utilisation telle que definie ci-dessus, pour le 
criblage de composes utiles dans le cadre du traitement ou de la prevention du diab&e, 
. notamment du diab&te de type II, de Pob6sit6, de l'acidose, de la c£tose, de l'arthrite, 
des cancers, ou de Tosteoporose, 
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DESCRIPTION DE LA FIGURE 1 

La Figure 1 represente le plasnride pFastBac~gfat-His6 de poids moteculaire 6,89 
kb. La cassette « Ampr» repnBsente un g&ie de resistance k Pampicilline, la cassette 
« ori » represente une origine de replication bacterieme, la cassette « Gmr » repr6sente 
un gene de resistance k la gentamicine, la cassette « Polh Pr » repr£sente le promoteur 
de la polyhSdrine, la cassette gfat-his6 reprSsente le gene gfatl modifi6 par l'insertion 
d'une sequence codant pour une etiquette hexahistidine. Les sites de restriction Xbal en 
position 4,1 1 kb, et EcoRI en positions 4,56 kb et 6,60 kb sont egaiement reprSsentes. 



t 
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EXEMPLE 1 

1. Synthase et clonafce du gene frfatl-ffis6 

Le fragment EcdRI d'vax ADNc correspondant au gene gfatl humain a et6 clone 
dans le site EcoR I du vecteur pCRU (Ihvitrogen) pour former le plasmide pCRE-gfatl. 
La sequence nucleotidique d'une etiquette de purification interne composee de 6 residus 
histidine a ete introduite en position 898 de la sequence du gene gfatl clone dans pCRII 
par PCR avec la Platinum pfa polymerase (Roche) et la pake d'amorces appropriees : 

- Start AatH-His6: 

5 ' TGG ACGTCTTTCTATCC ATCGAATTAAACGAACTGC AGGACATC ACC 
ATCACCATCACGATCACCCCGGACG 3' (SEQ ID NO : 14) 

-End Hindi: 

5' CAAAGTTGACTCTTCCTCTCATTGTGTTCACGACAGACTCTGGC 3' 
(SEQ ID NO: 15) 

selon le protocole suivant : 94°C, 2min puis 30 cycles (94°C 45 sec, 55°C 1 min, 72°C 
5 min) suivis d'une polymerisation de 5 min a 72°C et retour a 4°C. " 

Apres digestion par Aafil et HincS. puis purification sur gel d'agarose Seaplaque 
1,5% (Tebu), ramplicon (170 bp) a ete insere au niveau des sites de restriction 
correspondants dans la construction pCRH-gfatl. L'insert de 170 pb a ete introduit par 
ligation dans la construction avec un rapport 3:1 a 16°C pendant la nuit en presence de 
T4 DNA ligase (Nebs). Le melange de ligation (20 ul) ainsi obtenu a pennis de 
transformer une souche d'E. coli JM1 09 . Ensuite, le fragment Xbal- Hindm du plasmide 
recombinant pCRII-gfatl-His6 a ete clone dans le plasmide donneur pFastBacl (Life 
Technologies Ltd). Le plasmide pFastBac-gfat-His6 ainsi genere (Figure 1^ a ete verifi6 
par digestions multiples: Smal, AccVDral, PstEVXbal, et par sequencage. En vue 
d'am61iorer la construction, la sequence en amont du codon de demarrage a 6t6 mutee 
sur deux positions par PCR, avec la paire d'amorces suivante, afin d'enlever deux 
phases de lecture ouvertes en amont du gene gfatl :. 

- Start Xbal 

5' AATCTAGATTCATGCTCGAGCGGCCGCCAGTGTGATTGATATC 3" 
(SEQ ID NO: 16) 

I 
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- End Af el 

5' ATTTTTATCAGAGCGCTGGGGGTGGCTATTGACAGG 3' (SEQ ID NO : 

17) 

selon le protocole : 94°C 2 min, puis 30 cycles (94°C 15 sec, 55°C 30 sec, 68°C 1 min) 
suivis d'une polymerisation de 1 min a 68°C et retour a 4°C. 

Le fragment de PCR obtenu, contenant les deux mutations, a et6 purifi6 sur gel 
SeaPlaque (Tebu) a 0,7% puis diger6 par Xbal et Afel pour remplacer son homologue 
dans pFastBac-gfat-His6 afin de donner le plasmide donneur pFastBac-gfat-His6-2orf 
servant k la transposition dans les cellules DHlOBac (Life Technologies Ltd). La 
construction a ete verifi6e par digestions Smal, XbaUPstBl, XbaVHindUL, et par 
sequencage. 

Un bacmide recombinant a 6t6 isol6 apr&s transposition dans les cellules 
DHlOBac et utilisd pour transferer des cellules d'insecte Sf9 en presence de Lipofectin 
(Life Technologies Ltd). Les baculovirus obtenus ont 6t6 amplifies dans les cellules Sf9 
et le titre viral a et6 mesure a 5.1 0 7 pfu/ml. 

2. Production de la nroteine GFAT1-His6 

Des cellules d'insectes S£9 ont 6t6 cultiv6es a 28°C en presence de milieu SF900II 
(Life Technologies Ltd) en fioles de 5 L sous agitation a 100 rpm. Les cellules a une 
densite de 2.10 9 cellules fL ont 6t6 infect6es par le baculovirus recombinant obtenu ci- 
dessus avec une multiplied d'infection de 2 (pfu/cellule), puis cultivees durant 72 h. 

Les cellules et le surnageant ont ete separ6s par centrifugation (2500 g, 10 min a 
4°C). Les culots cellulaires ont ete laves enpr6sence de tampon Tris-HCl 20 mM, pH 7, 
centrifuges (4000 g, 45 min a 4°C) et congeles a -80°C. 

3. Purification de lanrot&ne GFAT1-His6 

Le culot cellulaire (20 g) a ett'repris dans 50 ml de tampon de lyse (NaP0 4 50mM 
pH 7,5, NaCl 300 mM, imidazole 10 mM, fructose-6-phosphate (fructose-6P) 1 mM, 
TCEP (Tris(2-carboxyethyl)phosphine) 1 mM, PMSF 1 mM (fluorure de 
phenylmethylsulfonyl), 10% glycerol et 1 tablette de cocktail d'inhibiteurs de proteases 
sans EDTA (Roche Applied Sciences) et soumis a un broyage au DynoMill a 4500 
trs/min (4 cycles de 30 sec) en presence de 40 g de microbilles de 0,2 mm de diametre. 
L'ensemble a &6 refroidi par circulation d'ethylene glycol/eau regl6 & -15°C. L'extrait 
brut obtenu (100 ml, 445 mg de proteines totales) a ete centrifuge a 4°C pendant 20 min 



•CM Ut3(JUt 

13 



a 12000 tpm. Le surnageant a ete soumis a une ultracentrifogation a 4°C (350000 tpm, 
lh). Le surnageant ainsi obtenu a ete m61ang6 a 5 ml de matrice 50% Ni-NTA (Qiagen) 
pendant 2 h a 4°C. Le melange a ete could dans une colonne vide puis rince avec 40 ml 
de tampon de lavage (NaP0 4 50 mM P H 7,5, NaCl 300 mM, imidazole 40 mM 
fructose-6P 1 mM, TCEP 1 mM, PMSF 1 mM et 1 tablette de cocktail d'inhibiteurs de 
proteases sans EDTA (Roche Applied Sciences). L'61ution a ete realis6e par paliers 
successifs a 125 et 500 mM imidazole dans le meme tampon que precedemment. 12 mg 
de GFAT1-His6 fonctionnelle (dosage proteique selon la melhode de Bradford ont ainsi 



ete obtenus. 



4. Conservation de 1'engy me GFAT1 JRi^ 

L'enzyme a alors ete stockee en fractions de 100 ul en presence de 1 mM 
fructose-6P, ImM TCEP et 10% glycerol a -80°C. La stabilite de Fenzyme est de 
plusieurs mois a -80°C et superieure a 8 jours a 4°C. 

5. Dosage de 1'ar.ti vjte de 1 Wy rne GFATI-W^fi 

Differents tests de dosage de Factivite enzymatique de la GFAT1-His6 ont et6 
utmsfe. Ces tests peuvent etre 6galement utilises afrn de cribler des compos6s 
modifiant, et notamment inhibant, Factivite de la GFAT1-His6. II est possible des les 
adapter aisement a un criblage a haut debit. 

Dosage de Morgan-Elson : 

Dans ce cas Factivite enzymatique est suivie par un test colorim6trique dont le 
pnncipe est le suivant : la D-glucosamine-oP liberie par Fenzyme est N-acetylee par 
Fanhydnde acetique en milieu alcalin (Ghosh et al, Method. Enzymol (1962) 5-414) 
purs La solution est traitee par le reactif d'Ehrlich (para.dim6thyl-amino-benzaId6hyde' 
PDAB) en milieu acide concentre ; le compose rose forme absorbe a 585 nm. 

La reaction enzymatique se deroule pendant 30 min a 37°C en presence de : 

- 0,2 ml de fructose-6P a 100 mM 

- 0,25 ml de L-Glutamine a 60 mM 

- 0,25 ml de tampon KP0 4 a 150 mM pH 7 

- 0, 1 ml d'EDTA Ethylene diamine tetra-acetate) a 25 mM, pd 7 
-jusqu'a 200 ul d'echantillon (a completer avec H 2 Q si neceisaire) 
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La reaction est stoppee par immersion 4 minutes dans un bain d'eau a 100°C puis 
centrifug6e. 0,8 ml du surnageant sont preleves pour le dosage de la glucosamine-6P 
suivant le protocole suivant : 

- addition de 0,1 ml de NaHC0 3 sature, 

5 - addition de 0,1 ml d'une solution d'anhydride acetique a 5 % dans l'eau 

prepar6e extemporanement, 

- agitation et incubation 5 min a temperature ambiante, 
-incubation 5 min dans un bain a 100°C, 

- addition de 0,2 ml de borate de potassium 0,8 M pH 9,1 (a ajuster avec KOH 
10 10N). 

-agitation et incubation 7 min dans un bain a 100°C. 

-addition de 3 ml de reactif d'Ehrlich dilu6 10 fois dans l'acide ac6tique, 
prepare extemporan6ment, sur la solution refixridie dans la glace, 

- incubation 20 min a 37°C. 
L'activite de la GFAT a 6te determine comparativement a une courbe etalon 

etablie en utilisant la D-giucosamine comme standard dans une gamme de concentration 
de 0 a 200 nmoles. L'activite specifique de la GFAT1-His6 obtenue a ete ainsi mesuree 
a 1,7 U/mg. Ce qui est superieur a la valeur de 0,4 U/mg obtenue par Broschat et aL, J. 
Biol. Chem. (2002) 277:14764, pour la purification d'une GFAT1 humaine 
recombinante. Ceci traduit une activite superieure de la GFAT1-His6 et/ou une purete 
plus importante de la preparation enzymatique selon l'invention. 
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25 



30 



Les parametres cin6tiques de la GFAT1-His6 ont et6 caracterises vis-a-vis de la 
glutamine (K^ = 0,2 mM) et du fructose-6P (F6P) (K ro F6P = 0,006 mM) par un dosage 
spectrophotometrique cou P 16 k la glutamate d6shydrogenase selon le test APAD. Ce qui 
est conforme aux valeurs citees dans l'art anterieur (K m 0,n = 0,26 mM et K m F6p = 0,007 
mM pour Broschat et al , J. Biol. Chem. (2002) 277: 14764). 

Dosage APAD 

II s'agit d'un dosage spectrophotometrique dans l'ultraviolet de l'activite GFAT. H 
est base sur la determination, en continu, de la quantite de L-glutamate forme a 1'aide de 
la GFAT et d'un analogue du NAD (nicotinamide adenine dinucleotide), l'APAD (3- 
acetylpyridine adenine dinucleotide), selon la reaction suivante (catalysee par la 
glutamate deshydrogenase (GDH)) : 
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L-Glu + APAD 



GDH * «" c6toglutarate + NH4 + + APADH 



La mesure s'effectue a 365 mn, a 37°C. Dans ces conditions une unite 
d'absorbance correspond a 0,1 1 umole d'APADH form6. 
L'essai comprend : 

- 100 ul APAD 3 mM (2 mg/ml) 
-25ulKC12M 

- 100 ul de tampon KP0 4 1 M pH 7,2 

- 100 ul de Fructose-6P 100 mM (30,41 mg/ml) 

- 100 ul de I^Glutamine 60 mM purifiee (8,77 mg/ml) 

- H 2 0 qsp 1 ml (en tenant compte des volumes a rajouter ci-apres) 
-50ulGDH 

- echantillon a doser : 0,5 ug 

n est 6galement possible. d'utiliser d'autres proced6s de dosage, tels que le dosage 
radiometrique decrit par Broschat et al., Analytical Biochem (2002) 305:10-15 ou le 
dosage dit Nitro Bleu Tetrazolium decrit par Nakata.e* al., J. Antibio. (2001) 54-737- 
743. ! . 
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REVENDICATIONS 

1. Prot6ine enzymatiquement active comprenant : 

- une sequence de GFAT et au moins une sequence d'une etiquette de 
purification, la sequence de l'etiquette de purification tent ins6ree entre deux 
acide amines consecutife de la sequence de GFAT, ou 

- une sequence derivant de la sequence precedente par suppression, insertion ou 
mutation d'au moins un acide amine, sous reserve que ladite proteine presente 
une activite enzymatique, ou 

- une sequence presentant au moins 35 % d'identit6 de sequence et/ou au moins 
44 % de similarite de sequence avec 1'une des sequences precedentes, sous 
r6serve que ladite proline presente une activite enzymatique. 

2. Proteine selon la revendication 1, dans laquelle la s6quence de GFAT correspond a 
une sequence de GFAT de bacterie ou d'eucaryote, notamment de plante, de 
champignon ou d'animal, en particulier d'insecte ou de mammifere, plus 
particulierement d'homme. 

3. Prot6ine selon la revendication 1 ou 2, dans laquelle la sequence de l'etiquette de 
purification est inseree entre deux acides amines consecutifs de la sequence de GFAT, 
lesdits acides amines tent compris dans : 

- une partie de la sequence de la GFAT correspondant a la sequence s'tendant 
entre le feuillet /32 et le feuillet 03 de la GFAT V Escherichia coli, ou 

- une partie de la s6quence de la GFAT correspondant a la sequence s'tendant 
entre le feuillet 013 et le feuillet 014 de la GFAT ^Escherichia coli, ou 

- une partie de la sequence de la GFAT correspondant a la s6quence s'tendant 
entre le feuillet (31 5 et l'helice o6 de la GFAT d' Escherichia coli. 

4. Prot6ine selon I'une des revendications 1 a 3, dans laquelle la sequence de GFAT 
correspond a : 

- SEQ ID NO : 2, correspondant a la sequence de la GFAT1 humaine, 

- SEQ ID NO : 4, correspondant a la sequence de la GFAT2 humaine, 

- SEQ ID NO : 6, correspondant a la sequence de la GFAT1 Alt humaine. 
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REVENDICATIONS 

1. Prot6ine correspondant k une glutamine:fractose-6-phosphate amidotransffcrase 
(GFAT) modifiee enzymatiquement active d f origine humaine, ladite GFAT 6tant 
modifiee de telle sorte qu'elle comprend au moins une sequence d'une Etiquette de 
purification correspondant k une sequence peptidique d'environ 2 a environ 10 acides 
amines, notamment d' environ 4 a environ 8 acides amin6s, susceptible de se lier 
specifiquement a un ligand donne, ce qui permet la formation d'un complexe entre la 
GFAT portant 1* etiquette de purification et ledit ligand, ledit complexe pouvant dtre 
sp6cifiquement isole, la sequence de 1* etiquette de purification 6tant inserSe entre deux 
acide amin6s consdcutifs de la sequence de GFAT, ces deux acides amines etant 
compris entre les acides amines : 

- 43 k 47, 298 a 306, et/ou 342 k 347 de SEQ ID NO : 2 de la GFAT1 humaine, 

- 42 a 45, 299 a 307, et/ou 343 k 348 de SEQ ED NO : 4 de la GFAT2 humaine, 

- 43 a 47, 3 16 a 324, et/ou 360 k 365 de SEQ ID NO : 6 de la GFAT1 Alt humaine. • 

2. Proteine selon la revendication 1, dans laquelle la sequence de P6tiquette de 
purification est ins6r6e entre les acides amines : i 
~299et300deSEQIDNO:2. $ 

- 300 et 301 de SEQ ID NO : 4 
317 et 318 de SEQ ID NO : 6 

3. Proteine selon la revendication 1 ou 2, dans laquelle Fetiquette de purification est une 
hexa-histidine. 

4. Proteine selon Tune des revendications 1 a 3 correspondant aux sequences : 

- SEQ ID NO : 8, correspondant k la sequence SEQ ID NO : 2 dans laquelle une 
hexa-histidine est inseree entre les acides amines 299 et 300, 

- SEQ ID NO : 10, correspondant a la sequence SEQ ID NO : 4 dans laquelle une 
hexa-histidine est ins6r6e entre les acides amines 300 et 301, et 

- SEQ ID NO : 12, correspondant k la sequence SEQ ID NO : 6 dans laquelle une 
hexa-histidine est ins6ree entre les acides amines 317 et 318 . 
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Modifiee le 



5. Proteine selon Tune des revendications 1 k 4, dans laquelle la sequence de PStiquette 
de purification est ins6r6e entre deux acides amines consecutifs, lesdits acides amines 
etant compris entre les acides amines : 

- 43 k 47, 298 k 306, et/ou 342 k 347 de SEQ ID NO : 2 

- 42 k 45, 299 k 307, et/ou 343 a 348 de SEQ ID NO : 4 

- 43 a 47, 316 k 324, et/ou 360 a 365 de SEQ ID NO : 6 

6. Proteine selon la revendication 5, dans laquelle la sequence de T&iquette de 
purification est ins6ree entre les acides amines : 

- 299 et 300 de SEQ ID NO : 2. 
-300 et 301 de SEQ ID NO : 4 

- 317 et 318 de SEQ ID NO : 6 

7- Proteine selon Tune des revendications 1 & 6, dans laquelle T etiquette de purification 
correspond a une sequence cT environ 2 a environ 10 acides amin6s, notamment 
d' environ 4 a environ 8 acides amin6s. 

8. Proteine selon l'une des revendications 1 & 7, dans laquelle l'etiquette de purification 
est une hexa-histidine. 

9. Proteine selon les revendications 6 et 8 correspondant aux sdquences : 

- SEQ ID NO : 8, correspondant k la sequence SEQ ID NO : 2 dans laquelle une 
hexa-histidine est inser6e entre les acides amines 299 et 300, 

- SEQ ID NO : 10, correspondant a la sequence SEQ ID NO : 4 dans laquelle une 
hexa-histidine est inser6e entre les acides aminds 300 et 301, et 

- SEQ ID NO : 12, correspondant k la s6quence SEQ ID NO ; 6 dans laquelle une 
hexa-histidine est inseree entre les acides amines 317 et 318. 

10. Acide nucl&que comprenant ou etant constitue d'une sequence codant pour une 
proteine selon Tune des revendications 1 & 9. 

11. Acide nucleique comprenant ou 6tant constitue de la sequence nucleotidique : 

- SEQ ID NO : 7 codant pour la proteine SEQ ID NO : 8, ou 

- SEQ ID NO : 9 codant pour la prot&ne SEQ ID NO : 10, ou ' 
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5. Acide nucl6ique comprenant ou etant constitu6 d'une sequence codant pour une 
prot&ne selon Tune des revendications 1 & 3. 

6. Acide nucleique comprenant ou 6tant constitue de la sequence nucl6otidique : 

- SEQ ID NO : 7 codant pour la proline SEQ ID NO : 8, ou 

- SEQ ID NO : 9 codant pour la proteine SEQ ID NO : 10, ou 

- SEQ ID NO : 1 1 codant pour la proteine SEQ ID NO : 12, 

ou de son compl&nentaire, ou 6tant derive de ladite sequence par mutation, insertion ou 
d616tion d'au moins un nucl6otide, sous reserve que ladite sequence nucleotidique code 
pour une proteine enzymatiquement active, 

7. Vecteur eucaryote ou procaryote comprenant un acide nucl&que selon la 
revendication 5 ou 6, 

8. ProcedS de purification d'une proteine selon Tune des revendications 1 k 3, k partir 
d'une solution comprenant ladite proteine, comprenant une 6tape de mise en presence 
de ladite solution avec un compose se liant sp6cifiquement a P Etiquette de purification 
de ladite proteine et une etape de separation du complexe forme par la liaison de ladite 
prot&ne audit compose des autres constituants de la solution. 

9. Procede de purification selon la revendication 10, comprenant une etape de mise en 
presence d'une solution comprenant une proteine selon la revendication 3 avec un 
compost comprenant un cation metallique divalent tel que Ni 2+ ou Co 2+ , notamment 
Ni 2+ , et une 6tape de separation du complexe forme par la liaison de la proteine audit 
compos6 des autres constituants de la solution. 

10. Proc6d6 de conservation d'une prot&ne selon Tune des revendications 1 a 3 sous 
une forme enzymatiquement active, notamment k -80°C ou k 4°C, comprenant 
Padjonction de ladite proteine k une solution comprenant : 

- d'environ 1 mM a environ 10 mM de fructose 6-phosphate, notamment environ 1 mM, 

- d' environ 1 mM a environ 5 mM de Tris(2-carboxyethyl)phosphine, notamment 
environ 1 mM, ' 

- d' environ 5 % k environ 20 % de glycerol, notamment environ 10%. 
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- SEQ ID NO : 1 1 codant pour la proline SEQ ID NO : 12, 

ou de son com P 16mentaire, ou 6tant d6riv6 de ladite sequence par mutation, insertion ou 
de!6uon d'au moins un nucleotide, sous reserve que ladite sequence nucl6otidique code 
pour une proteine enzymatiquement active. 

12. Vecteur eucaryote ou procaryote comprenant un acide nucleique selon la 
revendication 1 0 ou 1 1 . 

13. Precede de purification d'une prot6ine selon Tune des revendications 1 a 9, a partir 
d'une solution comprenant ladite proline, comprenant une etape de mise en presence 
de ladite solution avec un compos* se liant specifiquement a 1'etiquette de purification 
de ladzte P rot6ine et une etape de separation du complexe forme par la liaison de ladite 
proteme audit compos6 des autres constituants de la solution. 

14. Precede de purification selon la revendication 13, comprenant une etape de mise en 
presence d'une solution comprenant une proteine selon la revendication 9 avec un 
compose comprenant un cation metallique divalent tel que Ni 2 * ou Co 2 *, notamment 
Ni , et une 6tape de s6 P aration du complexe forme par la liaison de la proteine audit 
compos6 des autres constituants de la solution. 

15. Proced6 de conservation d'une proteine selon Tune des revendications 1 a 9 sous 
une forme enzymatiquement active, notamment a -80°C ou a 4°C, comprenant 
l'adjonction de ladite proteine a une solution comprenant : 

- d'environ 1 mM a environ 10 mM de fructose 6-phosphate, notamment environ 
1 mM, I 

- ^environ 1 mM a environ 5 mM de Tri S (2-carboxyethyl)phosphine, 
notamment environ 1 mM, 

- d'environ 5 % a environ 20 % de glycerol, notamment environ 10%. 

16. Composition comprenant une proteine GFAT active, le cas echeant liee a une 
etquette de purification, telle qu'une proteine selon 1'une des revendication 1 a 9 ladite 
proteine etant susceptible de pouvoir etre conserve sous une forme enzymatiquement 
active, durant an moins 8 jours a une temperature de 2°C a 10°C, notamment environ 
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11. Composition comprenant une proteine GFAT active liee k une Etiquette de 
purification selon Tune des revendication I k 3 9 ladite proteine etant susceptible de 
pouvoir Stre conserv6e sous une forme enzymatiquement active, durant au moins 8 jours 
k une temperature de 2°C k 10°C, notamment environ 4°C, et durant au moins 12 mois k 
une temperature de -100°C k -20°C, notamment environ -80°C, ladite proteine 6tant en 
association avec : 

- environ 1 mM k environ 10 mM de fructose 6-phosphate, notamment environ 1 mM, 

- environ 1 mM a environ 5 mM de Tris(2-carboxye1ixyl)phosphine ? notamment environ 
ImM, 

- environ 5 % a environ 20 % de glycerol, notamment environ 10%. 

12, Utilisation d'une proteine selon Tune des revendications 1 a 3, pour le criblage de 
composes modifiant Pactivit6 de ladite proteine, en particulier pour le criblage 
d'inhibiteur de ladite prot6ine, 

13. Utilisation selon la revendication 12, pour le criblage de composes utiles dans le< 
cadre du traitement ou de la prevention du diabete, notamment du diabete de type n, de, 
Tob6sit6, de l'acidose, de la c6tose, de rarthrite, des cancers, ou de Fost6oporose. 1 



1 er depot 
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Supprimee le 2< 



4°C, et durant au moins 12 mois k une temperature de -100°C k -20°C, notamment 
environ -80°C, ladite proteine 6tant en association avec : 

- environ 1 mM k environ 10 mM de fructose 6-pbosphate, notamment environ 1 
mM, 

- environ 1 mM k environ 5 mM de Tris(2-carboxyethyl)phosphine, notamment 
environ 1 mM, 

- environ 5 % k environ 20 % de glycerol, notamment environ 10%, 

17. Utilisation d'une proteine selon Tune des revendications 1 & 9, pour le criblage de 
composes modifiant T activity de ladite proteine, en particulier pour le criblage 
d'inhibiteur de ladite proline. 

18. Utilisation selon la revendication 17, pour le criblage de compos6s utiles dans le 
cadre du traitement ou de la prevention du diab&e, notamment du diabete de type II, de 
Tobesite, de Tacidose, de la cetose, de rarthrite, des cancers, ou de TosftSoporose. 
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<400> 1 

5£? ^ gt a ^ a fctt gct tac tta aac tac ca t gtt cct cga acg aaa 48 

Met Cys Gly He Phe Ala Tyr Leu Asn Tyr His Val Pro A?g 52' 25 
1 5 10 15 

a n° Ct9 gag aCC cta atc aaa 9gc ctt cag aga ctg gag tac 96 
Arg Glu lie Leu Glu Thr Leu He Lys Gly Leu Gin Arg Le5 IS 
20 25 30 



aga gga tat gat tct gct ggt gtg gga ttt gat gga ggc aat aat aaa ui 
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f at ^H? 9aa gCC aat gCC tgc aaa anc caa c tt att aag aaa aaa acta i 09 
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60 

{ 



L^ SX f a9 ^? a T ° tg gat gaa gaa gtt cac aaa caa caa gat atg gat 240 
jys Val Lys Ala Leu Asp Glu Glu Val His Lys Gin Gin Asp Me? Asp 

70 *7C ~ r 



75 80 



ttg gat ata gaa ttt gat gta cac ctt gga ata get cat acc cat t aa 
Leu Asp He Glu Phe Asp Val His Leu Gly He Ala His ?nr A?g & 
85 90 



288 



95 



f? a f£ a ° at gga gaa ccc aat cct afc c aat age cac ccc caa cac tct 
Ala Thr His Gly Glu Pro Ser Pro Val Asn sL His Pro 3E 2£ Ser 
100 105 110 



IS ? aa aa aat 9aa fctt atC gtt att cac aat atc atc acc aac 

Asp Lys Asn Asn Glu Phe He Val He His Asn lly He Se ?£r Ssn 
115 120 125 



tac aaa gac ttg aaa aag ttt ttg gaa age aaa ggc tat gac ttc aaa 
Tyr Lys Asp Leu Lys Lys Phe Leu Glu Ser Lys lly Tyr Asp pK f" 

x^u 135 14Q 



384 



432 



tct gaa aca gac aca gag aca att gcc aaq etc att aaa fcah fl hrr f a< - 
Ser Glu Thr Asp Thr Glu Thr lie Ala Lys ?" Lyl Tyr Se? Jjr 

155 160 

gac aat egg gaa agt caa gat acc age ttt act acc ttg gtg aaa aaa 
Asp Asn Arg Glu Ser Gin Asp Thr Ser Phe Thr Thr Leu Val Glu Ara 
165 170 175 a 

gtt ate caa caa ttg gaa ggt get ttt gca ctt qtq ttt aaa aat- r,+*- „ c 
Val lie Gin Gin Leu Glu Gly Ala Phe Ala Leu Val Phe Lyt sS Va^ " 6 
180 185 190 

cat ttt ccc ggg caa gca gtt ggc aca agg cga ggt aqc cct eta t-t-a 
His Phe Pro Gly Gin Ala Val Gly Thr A?f Arg !!y Ifr p ro 22 
13= 200 



2 05 



att ggt gta egg agt gaa cat aaa ctt tct act gat cac att cct ata 
He Gly val Arg Ser Glu His Lys Leu Ser Thr Asp His ?le S ill 

215 220 



gtg aac aca atg aga gga aga gtc aac ttt gat gac tat act at-a 
Val Asn Thr Met Arg Gly Arg Val Asn Phe Lp.Sp T?r S? Va? Asn 

345 350 

Leu P?i S?* r t9 ? a3 9at CaC ata aaa «ag ate cag aga tgc egg cat 
Leu Gly Gly Leu Lys Asp His lie Lys Glu He Gin. Arg Cys Arg Arg 
• 3i>i> 360 365 

£2 £ 2S S SS £• 3? S S £ S S IS SS S S 

375 380 

5 2 SS 2S SS oiu ffl £ SS S SS fa! S3 S3 SS » 



390 395 



4.0 0' 



624 



672 



720 



etc tac aga aca ggc aaa gac aag aaa gga age tgc aat etc tct ™t- 
Leu Tyr Arg Thr Gly Lys Asp Lys Lys l!y S J r c?s III LeS Ser Sg 

230 235 240 

?3 Sp S S S & 25 S SS ?3 SS IS £ S fa! SS 7S ° 

245 250 ' 255 

Kr !?! o Ct f at ff a agt gct gtc afca aaa ca <= acc aat cgc 

Tyr Tyr Phe Ala Ser Asp Ala Ser Ala Val lie Glu His Thr Asn A?g 

260 265 270 

«S £ S 22-E ES K S 82 g S ?2 ?2 a; S 
2S 2 S Si S SS £ 3 S E SJS ffi $ 25 

295 300 

lit f£? SS* ? tC ° ag atg gaa ctc caCT ca 9 ate atg aag ggc aac 9so 

Ala Val Gin Thr Leu Gin Met Glu Leu Gin Gin He Met Lyf %ly 

310 315 * 320 

J£ £ £ J2 i? SS » IE s 52 IS SS SS SS IS «S »" 

325 330 o-ic 



816 



864 



912 



gca agt gac ttc ctg gac aga aac aca cca gtc ttt cga gat gat gtt 



1056 



1104 



1152 



1200 



1248 



Ala Ser Asp Phe Leu Asp Arg Asn Thr Pro Val Phe Arg Asp Asp Val 
405 410 415 

S SS SS 25 £ S S If y ss « S L" SS SS ffi * 

425 



430 



£ s ss Si ss ss s i?; as a ss sa if? ss ss ss 

Ji> 440 445 

Tb^ S? 2?° e 9t o C ° 3ta tCa c 99 9 a 9 aca 3at tgt gga gtt cat att 
Thr Val Gly Ser Ser lie Ser Arg Glu Thr Asp Cys Ify Ss £e 

455 460 

a SS If? SS SS Si If? S3 S K5 SS SS SS SS SS IS 

475 4B0 



1296 



1344 



13 92 



1440 



1488 



1536 



1584 



1632 



a SS fS SS 25 Sf fi £ s 25 K SS gi g IS S 

490 495 

s s s ss as s ss ss ss ss ss is ss ss a 

505 510 

ss ss ss ss ss ss is ?a ss ss si ss ss is ss ss 

520 525 

SS £ SI 32 IS 25 SS Si SS SS £ SS SS SS SS IS 

b " 540 

2S 85 Si Si Si Si « Si Si SS if? S* SS Si SS Si 1630 

555 560 

SS Si ss ss SS Si SS SS If? SS Si Si is ss ss ss 

570 575 

Ss l?y HI S E J2 ?3 £ aa T tt9 atg cct 9t * atc at * »tc 

580 P yS U Met Pro Val rle Me t He 

585 590 

SS SS || SS SS SS SS SS SS Si SS Si SS 25 SS SS 

600 605 

sa ss ss a ss s? a ss sa ss ss si is 5- ss is 

615 620 

|S SS SS Si si ss ss ss s ss SS SS Sf ss ss ss 

635 640 

Sf SS 5?S SS SS If? Si SS SS S3 ss ss ss ss ss ss 

650 655 

Si SS Si 25 Si S3 SS SS If? SS SS ?S SS SS SS S» 



1728 



1776 



1824 



1872 



1920 



1968 



2016 




aat ctt gcc aaa tct gtg act gta gag tqa 
Asn Leu Ala Lys Ser Val Thr Val Glu 
67 5 680 



<210> 2 

<211> 681 

<212> PRT 

<213> Homo sapiens 



<220> 

<22l> niisc_feature 
<222> (57) . . (57) 

<223> he 'Xaa< en position 57 reprSsente Thr ou lie. 
<400> 2 

Met cys Gly He Phe Ala Tyr Leu Asn Tyr His Val Pro Arg Thr 



10 



15 



Arg 



Arg Glu n e Leu Glu Thr Leu He Lys Gly Leu Gin Arg Leu Glu Tyr 



Arg Gly Asp Ser Ala Qly ^ Qly ^ ^ ^ ^ ^ ^ 

Asp Trp Glu Ala Asn Ala Cys Lys Xaa Gin Leu Xle Lys Lys Lys Gly 

55 60 

Lys Val Lys Ala Leu Asp Glu Glu Val His Lys Gin Gin Asp Met Asp 

75 .80 

Leu Asp He Glu Phe Asp Val His Leu Gly He Ala His Thr Arg Trp 

Ala Thr His Gly Glu Pro Ser Pro Val Asn Ser His Pro Gin Arg Ser 

105 110 

Asp Lys' Asn Asn Glu Phe He Val He His Asn Gly Xle He Th* Asn 

120 125 

Lys Asp Leu Lys Lys Phe Leu Glu Ser Lys Gly Tyr Asp Phe Glu 

■ 135 140 

Ser Glu Thr Asp Thr Glu Thr He Ala Lys Leu Val Lys Tyr Met Tyr 

. 155 160 

Asp Asn Arg Glu Ser Gin Asp Thr Ser Phe Thr Thr Leu Val Glu Arg 

170. 175 

Val Xle Gin Gin Leu Glu Gly Ala Phe Ala Leu Val Phe Lys Ser Val ' 



185 



190 
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His Phe Pro Gly Gin Ala Val Gly Thr Arg Arg Gly Ser Pro Leu Leu 
195 200 205 

lie Gly Val Arg Ser Glu His Lys Leu Ser Thr Asp His He Pro He 
- 210 215 220 

Leu Tyr Arg Thr Gly Lys Asp Lys Lys Gly Ser Cys Asn Leu Ser Arg 

230 235 240 



Val Asp ser Thr Thr Cys Leu Phe Pro Val Glu Glu Lys Ala Val Glu 
245 250 255 

Tyr Tyr Phe Ala Ser Asp Ala Ser Ala Val He Glu His Thr Asn Arg 

265 270 

Val lie Phe Leu Glu Asp Asp Asp Val Ala Ala Val Val Asp Gly Arg 
275 280 285 

Leu Ser lie His Arg He Lys Arg Thr Ala Gly Asp His Pro Gly Arg 

295 30 0 

Ala Val Gin Thr Leu Gin Met Glu Leu Gin Gin He Met Lys Gly Asn 

315 320 

Phe Ser Ser Phe Met Gin Lys Glu He Phe Glu Gin Pro Glu Ser Val 
325 330 335 

Val Asn Thr Met Arg Gly Arg Val Asn Phe Asp Asp Tyr Thr Val Asn 



340 345 350 



Leu Gly Gly Leu Lys Asp His He Lys Glu He Gin Arg Cys Arg Arg 
* 360 365 

Leu lie Leu He Ala Cys Gly Thr Ser Tyr His Ala Gly Val Ala Thr 

375 380 



Arg Gin Val Leu Glu Glu Leu Thr Glu Leu Pro Val Met Val Glu Leu 

390 395 400 

Ala ser Asp Phe Leu Asp Arg Asn Thr Pro Val Phe Arg Asp Asp Val 

410 415 

Cys Phe Phe Leu Ser Gin Ser Gly Glu Thr Ala Asp Thr Leu Met Gly 



425 430 



Leu Arg Tyr Cys Lys Glu Arg Gly Ala Leu Thr Val Gly He Thr Asn 

440 445 

Thr Val Gly Ser Ser He Ser Arg Glu Thr Asp Cys Gly Val His He 



460 



Asn Ala Gly Pro Glu lie Gly Val Ala Ser Thr Lys Ala Tyr Thr Ser 
465 470 475 480 



Gin Phe Val Ser Leu Val Met Phe Ala Leu Met Met Cys Asp Asp Arg 



485 



490 



495 



He Ser Met Gin Glu Arg Arg Lys Glu He Met Leu Gly Leu Lys Arg 



505 



510 



Leu Pro Asp Leu He Lys Glu Val Leu Ser Met Asp Asp Glu He Gin 
515 520 525 



Lys Leu Ala Thr Glu Leu Tyr His Gin Lys Ser Val Leu He Met Gly 

530 of? — - - J 



535 



540 



Arg Gly Tyr His Tyr Ala Thr Cys Leu Glu Gly Ala Leu Lys He Lys 
34b 550 J 



555 



560 



Glu He Thr Tyr Met His Ser Glu Gly He Leu Ala Gly Glu Leu Lys 
565 570 575 

His Gly Pro Leu Ala Leu Val Asp Lys Leu Met Pro Val He Met He 
S80 585 590 

He Met Arg Asp His Thr Tyr Ala Lys Cys Gin Asn Ala Leu Gin Gin 
595 600 605 

Val Val Ala Arg Gin Gly Arg Pro Val Val He Cys Asp Lys Glu Asp 

Thr Glu Thr He Lys Asn Thr Lys Arg Thr He Lys Val Pro His Ser 
25 630 635 640 

Val Asp cys Leu Gin Gly He Leu Ser Val He Pro Leu Gin Leu Leu 
645 650 655 

Ala Phe His Leu Ala Val Leu Arg Gly Tyr Asp Val Asp Phe Pro Arg 
660 665 670 

Asn Leu Ala Lys Ser Val Thr Val Glu 
675 680 
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Homo sapiens 


<220> 




<221> 
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<222> 


(1) . . (2049) 
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<223> 
<400> 3 



a % if? a is is £ a ss - ^ is is si a si 

10 15 

£ S! S 52 IS £ £ £ SI SS 2! H S H SS £ 

25 30 

s «? £ is a e is ca si a e - a - K E 
ss si is s a a a is a a si is a - « 
is a a is is a £ a a a s s - £ - ^ 

SS £ IS S ffi £ l!y SI IS S g 2S iS S SI S 

105 110 

SS IS £ SS ?S £ ffi LS If? £ £ S SS £ £ £ 

125 

SS £ SI £ SI IS S SS IS £ IS IS IS £ IS SI 

a s a s £ IS SI SS £ SS is is is ss ss 

155 160 

IS £ IS £. £ £ IS £ £ £ IS IS JS IS £ SS 

170 175 

ss si is is is is is a is is si a is s £' s* 

185 19Q 

IS IS IS IS s s a s IS SI IS SI a £ IS IS 

200 205 

ss s si £ si ais si is a a is is a £ st 

220 3 

£ SI £ SI IS SI IS SI SS £ £ SI SI SS £ SI 

235 240 

si a is si si ss £ si si is is is r s* ^ *• 

245 y A5p L ^ s Ala Val 

250 255 



48 



36 



144 



192 



240 



288 



336 



384 



432 



480 



528 



576 



624 



672 



720 



768 



ft a ^° fc 5 C fctt gct tct gat 9 ca a 9c get ate ata gaq cac aec aa n 
Glu Phe Phe Phe Ala Ser Asp Ala sir Ala He lie SX SS ?nr IE 
* 6 w 265 



270 



egg gtc ate ttc ctg gag gac gat gac ate gee gca gtg qctaat aoa 
Arg val lie Phe Leu Glu Asp Asp Asp He Ala Ala fa! III Isp g? 



285 



aaa etc tec att Cac egg gtc aag cgc teg gee agt gat qac cca fcefc 
Lys Leu Ser He His Arg Val Lys Arg Ser Ila Ser Isp Asp Pro Ser 

^ y j5 -s ** 



300 



cga gee ate cag ace ttg cag atg gaa ctg eag caa ate ata aa * « a t- 
Arg Ala lie Gin Thr Leu Gin Met Ilu Leu Gin SS Se Me? lys §R 

310 315 • 32 £ 



!£ c agt 9=9 fc tt atg cag aag gag ate ttc gaa cag cca aaa tea 
Asn Phe Ser Ala Phe Met Gin Lys Glu He Phe llu Gil Pro IS Ser 

330 335 

!S £ a S S a 8g 2S S3 a a ffi K ± S 52 

34 5 350 

X S || S5 £3 5! a ffi a a a * £ s £ s 

si a s ?3 a a? a i?; is s a a 5 s a a 
s a sx a a is a a a is a a a a a ss 

395 400 

a a s a a a a a a a a a s a a a 

415 

S2 Cys Pne Phe Se Ser 35 ?* ?? C 9 ^ S ° g 9a< = 3CC Ctc cfc g 

<-ys Pne Phe He Ser Gin Ser Gly Glu Thr Ala Asp Thr Leu Leu 

425 430 

All Itu a?° S? C ~ 9t a&9 ga ° cgc 9gc gct ctc ace gtg gg C gtc acc 
Ala Leu Arg Tyr Cys Lys Asp Arg Gly Ala Leu Thr Val Gly VaL Thr 

440 445 f 

a s a a s a a a a ss s a m a a a 
a a s a =s a a aaa s s a a a s 

470 -475 480 

a a s a a a a a a a a a a a a a 

490 " 495 

a a a a a a a a k a a a a a a a 

510 

gag gag aag ate 



500 ~ ' 505 510 

tct tta cct gag ctg ate aag gaa gtg ctg tct ctg 
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Ser Leu Pro Glu Leu He Lys Glu Val Leu Ser Leu Glu Glu Lys He 
515 520 525 

cac gac ttg gcc ctg gag etc tac acg cag aga teg ctg ctg gtg atg 1632 
His Asp Leu Ala Leu Glu Leu Tyr Thr Gin Arg Ser Leu Leu Val Met 
530 535 540 

999 egg ggc tac aac tat gcc acc tgc ctg gaa gga gcc ctg aaa att 1680 
Gly Arg Gly Tyr Asn Tyr Ala Thr Cys Leu Glu Gly Ala Leu Lys He 
545 550 555 560 

aaa gag ata acc tac atg cac tea gaa ggc ate ctg get ggg gag ctg 1728 
Lys Glu He Thr Tyr Met His Ser Glu Gly He Leu Ala Gly Glu Leu 
565 570 575 

aag cac ggg ccc ctg gca ctg att gac aag cag atg ccc gtc ate atg 1776 
Lys His Gly Pro Leu Ala Leu He Asp Lys Gin Met Pro Val He Met 
580 585 590 

gtc att atg aag gat cct tgc ttc gcc aaa tgc cag aac gcc ctg cag 1824 
Val He Met Lys Asp Pro Cys Phe Ala Lys Cys Gin Asn Ala Leu Gin 
595 600 605 

caa gtc acg gcc cgc cag ggt cgc ccc att ata ctg tgc tec aag gac 1872 
Gin Val Thr Ala Arg Gin Gly Arg Pro He He Leu Cys Ser Lys Asp 
610 615 620 

gat act gaa agt tec aag ttt gcg tat aag aca ate gag ctg ccc cac 1920 
Asp Thr Glu Ser Ser Lys Phe Ala Tyr Lys Thr He Glu Leu Pro His 
"5 630 635 640 

act gtg gac tgc etc cag ggc ate ctg age gtg att ccg ctg cag ctg 1968 
Thr Val Asp Cys Leu Gin Gly He Leu Ser Val He Pro Leu Gin Leu 
645 650 655 

ctg tec ttc cac ctg get gtt etc cga gga tat gac gtt gac ttc ccc 2016 
Leu Ser Phe His Leu Ala Val Leu Arg Gly Tyr Asp Val Asp Phe Pro 
660 665 * 670 

aga aat ctg gcc aag tct gta act gtg gaa tga 2049 
Arg Asn Leu Ala Lys Ser Val Thr Val Glu 
675 680 

<210> 4 
<211> 682 
<212> PRT 

<213> Homo sapiens f 
<400> 4 

Met Cys Gly He Phe Ala Tyr Met Asn Tyr Arg Val Pro Arg Thr Arg 
1 5 10 15 

Lys Glu He Phe Glu Thr Leu He Lys Gly Leu Gin Arg Leu Glu Tyr 
20 25 30 

Arg Gly Tyr Asp Ser Ala Gly Val Ala He Asp Gly Asn Asn His Glu 
35 40 45 



Val Lys Glu Arg His He Gin Leu Val Lys Lys Arg Gly Lys Val Lys 
50 55 60 
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Ala Leu Asp Glu Glu Leu Tyr Lys Gin Asp Ser Met Asp Leu Lys Val 
65 70 75 80 

Glu Phe Glu Thr His Phe Gly He Ala His Thr Arg Trp Ala Thr His 
85 90 95 

Gly Val Pro Ser .Ala Val Asn Ser His Pro Glu Arg Ser Asp Lys Gly 
100 105 110 

Asn Glu Phe Val Val He His Asn Gly He He Thr Asn Tyr Lys Asp 
115 120 125 

Leu Arg Lys Phe Leu Glu Ser Lys Gly Tyr Glu Phe, Glu Ser Glu Thr 
130 135 140 

Asp Thr Glu Thr He Ala Lys Leu He Lys Tyr Val Phe Asp Asn Arg 
14 5 150 155 160 

Glu Thr Glu Asp He Thr Phe Ser Thr Leu Val Glu Arg Val He Gin 
165 170 ~ 175 

Gin Leu Glu Gly Ala Phe Ala Leu Val Phe Lys Ser Val His Tyr Pro 
180 185 * 190 

Gly Glu Ala Val Ala Thr Arg Arg Gly Ser Pro Leu Leu He Gly Val 
195 200 205 

Arg Ser Lys Tyr Lys Leu Ser Thr Glu Gin He Pro He Leu Tyr Arg 
210 215 220 

Thr Cys Thr Leu Glu Asn Val Lys Asn lie Cys Lys Thr Arg Met Lys 
225 230 235 ~ 240 

Arg Leu Asp Ser Ser Ala Cys Leu His Ala Val Gly Asp Lys Ala Val 
245 250 255 

Glu Phe Phe Phe Ala Ser Asp Ala Ser Ala He He Glu His Thr Asn 
260 265 270 

Arg Val He Phe Leu Glu Asp Asp Asp He Ala Ala Val Ala Asp Gly 
275 280 285 

Lys Leu Ser He His Arg Val Lys Arg Ser Ala Ser Asp Asp Pro Ser 
290 295 3 00 

Arg Ala He Gin Thr Leu Gin Met Glu Leu Gin Gin He Met Lys Gly 
305 310 315 320 



Asn Phe Ser Ala Phe Met Gin Lys Glu He Phe Glu Gin Pro Glu Ser 
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325 330 335 

Val Phe Asn Thr Met Arg Gly Arg Val Asn Phe Glu Thr Asn Thr Val 
340 345 350 

Leu Leu Gly Gly Leu Lys Asp His Leu Lys Glu lie Arg Arg Cys Arg 
355 360 365 

Arg Leu lie Val lie Gly Cys Gly Thr Ser Tyr His Ala Ala Val Ala 
370 375 380 

Thr Arg Gin Val Leu Glu Glu Leu Thr Glu Leu Pro Val Met Val Glu 
385 390 395 400 

Leu Ala Ser Asp Phe Leu Asp Arg Asn Thr Pro Val Phe Arg Asp Asp 
405 410 415 

Val Cys Phe Phe He Ser Gin Ser Gly Glu Thr Ala Asp Thr Leu Leu 
420 425 430 

Ala Leu Arg Tyr Cys Lys Asp Arg Gly Ala Leu Thr Val Gly Val Thr 
435 440 445 

Asn Thr Val Gly Ser Ser He Ser Arg Glu Thr Asp Cys Gly Val His 
450 455 460 

He Asn Ala Gly Pro Glu Val Gly Val Ala Ser Thr Lys Ala Tyr Thr 
4 65 470 475 480 

Ser Gin Phe He Ser Leu Val Met Phe Gly Leu Met Met Ser Glu Asp 
485 490 495 

Arg He Ser Leu Gin Asn Arg Arg Gin Glu He He Arg Gly Leu Arg 
500 505 510 

Ser Leu Pro Glu Leu He Lys Glu Val Leu Ser Leu Glu Glu Lys *Ele 
515 520 525 

His Asp Leu Ala Leu Glu Leu Tyr Thr Gin Arg Ser Leu Leu Val Met 
530 535 540 

Gly Arg Gly Tyr Asn Tyr Ala Thr Cys Leu Glu Gly Ala Leu Lys He 
545 550 555 560 

Lys Glu He Thr Tyr Met His Ser Glu Gly He Leu Ala Gly Glu Leu 
565 570 575 

Lys His Gly Pro Leu Ala Leu He Asp Lys Gin Met Pro Val He Met 
580 585 590 




Val He Met Lys Asp Pro Cys Phe Ala Lys Cys Gln Asn Ala Leu Gin 

600 605 

Gin Val Thr Ala Arg Gin Gly Arg Pro He lie Leu Cys Ser Lys Asp 

ASP Thr Glu Ser Ser Lys Phe Ala *yr Lys Thr lie Glu Leu Pro His 

635 640 

Thr Val Asp Cys Leu Gin Gly He Leu Ser Val He P,o Leu Gin Leu 

650 655 

Leu Ser Phe His Leu Ala Val Leu Arg Gly Tyr Asp .Val Asp Phe Pro 

boo 



670 



Arg Asn Leu Ala Lys Ser Val Thr Val Glu 
675 680 
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<221> CDS 

<222> (l) (2100) 
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<220> 

< 2 2 1 > mi s cofeature 

<222> (170) . . (170) 

<223> t ou c 



<400> 5 



fi §J a? s: S2 s £ s s £ ss ss - s s s 

S 3 * IS US S 2 ; - - ag - ffi _ «. ^ 

25 30 
^9a gga tat gat tct get qqt ata 00=, 4-*-4- 

«r gr ^ Ser Su Ify ? ! If? 52 S SJ If* J£ 55 £ 

40 4S 

s § s e ss k s s = a s s « « s: is 
? « s k 2s si is & s =fS? ~ - - a j- 

75 80 

a aj a is 52 is ss ss as is s ss is s s g » »• 

90 95 



96 



144 



192 



240 
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s 

lit ?hr Si Gly Uu Pro S£ S S? ^ ° aC CCC Ca * c ^ tot 
100 r ° Y*i A8n Ser His Pro Gin Arg Ser 

105 110 

gat aaa aat aat gaa ttt ate «n- =«-*■ 

Asp Lys Asn Asn Glu Phe iff ?»? ??J * at 9 ? a atc atc acc ^ao 

115 116 Ile His Asn G3 -y He He Thr Asn 

120 125 

a a a a a a £ a & s a &? a a a is 

. 140 

S2 IS S S= S IS g gj k S a ff ?* 9 tat tat 

145 150 7 1 LyS ^ Met Tyr 

155 160 

a a a a s is is s a s a s a a ss si 

170 175 
gtt atc caa caa ttg gaa got act t-t-f- nM . 

no «u «. to 8u a a s a a ss s ss 

185 190 

S S S If? s s ?S IS S 3 a if? a a s a 

^ 00 205 

a a a si s c a a a a a is a s a a 

^ X1> 22 0 

a a a a a s s a a a a a a a a a 

235 240 

a a a is s « - s - 1?; s ^ a 2S 

250 255 

a a a a a a a a a a a a is is a s 

265 270 
gag tat tac ttt act t-r*t- ~ 
Val Glu Tyr Tvr Phe llZ SII 2" f? a agt 9 tc ata gaa cac acc 

275 * ^ a ber Asp Ala ser Ala Val Ile Glu His Thr 

^ 80 285 

a a a a a a is a - a a s s a a'a 

300 * 

§ a a a a a a a a a a s is a a ss 

315 320 

a a a a a a a a a is a a a a a a 
a a a a a a a a a a a a a a a a 
a a a ss a a a a a a ss a a a a ss 



336 



384 



432 



480 



528 



576 



624 



672 



720 



768 



816 



864 



912 



960 



1008 



1056 



1104 




■ tii uepoi 

355 



360 365 



• sa s a « ® a ^ g B £ s H a H a^ ^ 1152 

25 380 • * 

i s £ a £ a a ss is s s £ a s e e - 

395 400 

e s a a Sji 2 a is a s s a s a a a - 

410 415 

a £ s s e £ a e i - - - * B s jg 

425 430 
gat gtt tgc ttt ttc ctt aqt caa t« 

*»P vax eg Phe Phe Lsu s f r |£ £ f£ IS £ S |« « ttj 

40 445 

£ § £ SI £ £ lJ| ffi s © E E £ 85 If? £ 

" b 460 * 

a a s ss e s a a s; s K s e * - -g 

cat 475 480 

His ne 12 ffi Gly Pro IS gj g£ £f c 9t 3Ca ^ ct tat 

485 Gly J?i Ala Ser hya Ala Tyr 

430 495 

S si? S2 2. SS 22 SJf 2? 2i ST T ctt atg at * gat 

500 - ™J phe *!• Leu Met Met Cys Asp 

SUI> 5X0 

a ss a a a s e e a e 8 a s a e a 
s i a a e si a » e - a g a a s 
a a a s s s is £ £ a a »i £ ?« a, s . 

at 555 560 

E 5 Ify £ S £ E £ £ £ I" 9S E £ ss 

at 570 575 

- a s a a - £ s £ s if? a £ e e c 

585 590 

£ £ E E £ £ E £ £ - £ £ £ £ £ £ 

S 0 5 

Me? xS JS Se? 25 S! *t | 

610 y P Tnr A1 * Lys Cys Gin Asn Ala Leu ' 



1296 



1344 



1392 



1440 



1488 



1536 



1584 



1632 



1680 



1728 



1776 



1824 



1872 

620 | 



I 

■v 



1er depot 



cag caa gtg gtt get egg cag ggg egg cct gtg gta att tgt gat aag 1920 
Gin Gin Val Val Ala Arg Gin Gly Arg Pro Val Val He Cys Asp Lys 
625 630 635 * 640 

gag gat act gag acc att aag aac aca aaa aga acg ate aag gtg ccc 1968 
Glu Asp Thr Glu Thr He Lys Asn Thr Lys Arg Thr He Lys Val Pro 
645 650 " 655 

cac tea gtg gac tgc ttg cag ggc att etc age gtg ate cct tta cag 2016 
His Ser Val Asp Cys Leu Gin Gly He Leu Ser Val He Pro Leu Gin 
660 665 670 

ttg ctg get ttc cac ctt get gtg ctg aga ggc tat gat gtt gat ttc 2064 
Leu Leu Ala Phe His Leu Ala Val Leu Arg Gly Tyr Asp Val Asp Phe 
675 680 " 685 

cca egg aat ctt gec aaa tct gtg act gta gag tga 2100 
Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 
690 695 

<210> 6 

<211> 699 

<212> PRT 

<213> Homo sapiens 

<220> 

<221> misc_Jceature 

<222> (57) . - (57) 

<223> Le 'Xaa 1 en position 57 represente Thr ou He. 

<400> 6 

Met Cys Gly He Phe Ala Tyr Leu Asn Tyr His Val Pro Arg Thr Arg 
1 5 X0 15 

Arg Glu He Leu Glu Thr Leu He Lys Gly Leu Gin Arg Leu Glu Tyr 
20 25 30 

Arg Gly Tyr Asp Ser Ala Gly Val Gly Phe Asp Gly Gly Asn Asp Lys 
35 40 ' 45 

Asp Trp Glu Ala Asn Ala Cys Lys Xaa Gin Leu He Lys Lys Lys Gly 
50 55 60 } 

Lys Val Lys Ala Leu Asp Glu Glu Val His Lys Gin Gin Asp Met Asp 
65 70 75 80 

Leu Asp He Glu Phe Asp Val His Leu Gly He Ala His Thr Arg Trp 
85 90 95 

Ala Thr His Gly Glu Pro Ser Pro Val Asn Ser His Pro Gin Arg Ser 
100 105 HO 

Asp Lys Asn Asn Glu Phe He Val lie His Asn Gly He He Thr Asn 
115 120 125 



Tyr Lys Asp Leu Lys Lys Phe Leu Glu Ser Lys Gly Tyr Asp Phe Glu 



1 er depot 



130 



135 



140 



Ser Glu Thr Asp Thr Glu Thr lie Ala Lys Leu Val Lys Tyr Met Tyr 
145 150 155 " 160 



Asp Asn Arg Glu Ser Gin Asp Thr Ser Phe Thr Thr Leu Val Glu Arg 
165 170 175 



Val lie Gin Gin Leu Glu Gly Ala Phe Ala Leu Val Phe Lys Ser Val 
180 185 .190 



His Phe Pro Gly Gin Ala Val Gly Thr Arg Arg Gly Ser Pro Leu Leu 
195 200 205 

lie Gly Val Arg Ser Glu His Lys Leu Ser Thr Asp His lie Pro He 
210 215 220 

Leu Tyr Arg Thr Ala Arg Thr Gin He Gly Ser Lys Phe Thr Arg Trp 
225 230 235 240 

Gly Ser Gin Gly Glu Arg Gly Lys Asp Lys Lys Gly Ser Cys Asn Leu 
245 250 255 

Ser Arg Val Asp Ser Thr Thr Cys Leu. Phe Pro. Val Glu Glu Lys Ala 
260 265 270 

Val Glu Tyr Tyr Phe Ala Ser Asp Ala Ser Ala Val He Glu His Thr 
275 280 285 

Asn Arg Val He Phe Leu Glu Asp Asp Asp Val Ala Ala Val Val Asp 
290 295 300 

Gly Arg Leu Ser He His Arg He Lys Arg Thr Ala Gly Asp His Pro 
305 310 315 * 320 

Gly Arg Ala Val Gin Thr Leu Gin Met Glu Leu Gin Gin He Met ? Lys 
325 330 335 

Gly Asn Phe Ser Ser Phe Met. Gin Lys Glu lie Phe Glu Gin Pro Glu 
340 345 350 

Ser Val Val Asn Thr Met Arg Gly Arg Val Asn Phe Asp Asp Tyr Thr 
355 360 365 

Val Asn Leu Gly Gly Leu Lys Asp His He Lys Glu He Gin Arg Cvs 
370 375 380 

Arg Arg Leu He Leu He Ala Cys Gly Thr Ser Tyr His Ala Gly Val 
385 390 395 400. 



_ Ala Thr Arg Gin Val Leu Glu Glu Leu Thr Glu Leu Pro Val Met Val 
Glu Leu Ala Ser Asp Phe Leu Asp Arg Asn Thr Pro Val phe ^ Agp 



Asp val cys Phe Phe Leu Ser Gin Ser Gly Glu Thr Ala 



440 



445 



43.0 



Asp Thr Leu 



Met Gly Leu Arg Tyr Cys. Lys Glu Arg Gly Ala Leu Thr Val Gly He 

455 460 

Thr Asn Thr Val Gly Ser Ser lie Ser Arg Glu Thr Asp Cys Gly Val 

475 480 

His He Asn Ala Gly Pro Glu He Gly Val Ala Ser Thr Lys Ala Tyr 

490 495 

Thr ser Gin Phe Val Ser Leu Val Met Phe Ala Leu Met Met Cys Asp 



510 



Asp Arg lie Ser Met Gin Glu Arg Arg Lys Glu He 



520 



Met Leu Gly Leu 
525 



XOT- jrg Leu Pro Asp Leu lie Lys Glu Val Leu Ser Met Asp Asp Glu 

535 540 

lie Gin Lys Leu Ala Thr Glu Leu Tyr His Gin Lys Ser Val Leu He 

555 560 

Met Gly Arg Gly Tyr His Tyr Ala Thr Cys Leu Glu Gly Ala Leu Lys 

570 575 

He Lys Glu lie Thr Tyr Met His Ser Glu Gly He Leu Ala Gly Glu 

585 590 ? 

Leu Lys His Gly Pro Leu Ala Leu Val Asp Lys Leu Met Pro Val He 

600 605 

Mat He He Met Arg Asp His Thr Tyr Ala Lys Cys Gin Asn Ala Leu 

bJ - S 620 

Jin Gin val Val Ala Arg Gin Gly Arg Pro Val Val He Cys Asp Lys 

635 640 
«« Asp Thr B, Tta XI, Ly5 iBn Thc Rrg Thr ^ Ly8 ^ ^ 

650 655 

His Ser Val Asp Cys Leu Gin Gly He Leu Ser Val He Pro Leu Gln 



1er depdt 



660 665 670 

Leu Leu Ala Phe His Leu Ala Val Leu Arg Gly Tyr Asp Val Asp Phe 
675 680 ~ 685 

Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 
690 695 

<210> 7 

<211> 2064 

<212> ADN 

<213> Sequence artificielle 
<220> 

<223> GFAT1 modifiee par une Etiquette de purif ication interne 
<220> 

<221> CDS 

<222> (1) . „ (2064) 

<223> 

<220> 

<221> misc_f eature 

<222> (170) . . (170) 

<223> t ou c 

<400> 7 

atg tgt ggt ata ttt get tac tta aac tac cat gtt cct cga acg aga 48 

Met Cys Gly lie Phe Ala Tyr Leu Asn Tyr His Val Pro Arg Thr Arg 

1 5 10 15 

cga gaa ate ctg gag acc eta ate aaa ggc ctt cag aga ctg gag tac 96 
Arg Glu He Leu Glu Thr Leu He Lys Gly Leu Gin Arg Leu Glu Tyr 
20 25 30 

aga gga tat gat tct get ggt gtg gga ttt gat gga ggc aat gat aaa 144 
Arg Gly Tyr Asp Ser Ala Gly Val Gly Phe Asp Gly Gly Asn Asp Lys 
35 40 45 

gat tgg gaa gec aat gee tgc aaa anc cag ctt att aag aag aaa gga 192 
Asp Trp Glu Ala Asn Ala Cys Lys Xaa Gin Leu He Lys Lys Lys Gly 
50 55 60 

aaa gtt aag gca ctg gat gaa gaa gtt cac aag caa caa gat atg * gat 24 0 

Lys Val Lys Ala Leu Asp Glu Glu Val His Lys Gin Gin Asp Met Asp 
65 70 75 80 

ttg gat ata gaa ttt gat gta cac ctt gga ata get cat acc cgt tgg 288 
Leu Asp He Glu Phe Asp Val His Leu Gly He Ala His Thr Arg Trp 
85 .90 95 

gca aca cat gga gaa ccc agt cct gtc aat age cac ccc cag cgc tct 33 6 

Ala Thr His Gly Glu Pro Ser Pro Val Asn Ser His Pro Gin Arg Ser 
100 105 110 



gat aaa aat aat gaa ttt ate gtt att cac aat gga ate ate acc aac 
Asp Lys Asn Asn Glu Phe He Val He His Asn Gly He He Thr Asn 
115 120 . 125 

tac aaa gac ttg aaa aag ttt ttg gaa age aaa ggc tat gac ttc gaa 
Tyr Lys Asp Leu Lys Lys Phe Leu Glu Ser Lys Gly Tyr Asp Phe Glu 
13 0 135 140 



384 



432 



1er depot 



tct gaa aca gac aca gag aca att gcc aag etc gtt aag tat atg tat 
Ser Glu Thr Asp Thr Glu Thr He Ala Lys Leu Val Lys Tyr Met Tyr 
145 150 155 * 160 

gac aat egg gaa agt caa gat acc age ttt act ace ttg gtg gag aga 
Asp Asn Arg Glu Ser Gin. Asp Thr Ser Phe Thr Thr Leu Val Glu Arg 
165 170 175 

gtt ate caa caa ttg gaa ggt get ttt gca ctt gtg ttt aaa agt gtt 
Val He Gin Gin Leu Glu Gly Ala Phe Ala Leu Val Phe Lys Ser Val 
180 185 190 

cat ttt ccc ggg caa gca gtt ggc aca agg cga ggt age cct ctg ttg 
His Phe Pro Gly Gin Ala Val Gly Thr Arg Arg Gly Ser Pro Leu Leu 
195 200 " 205 

att ggt gta egg agt gaa cat aaa ctt tct act gat eac att cct ata 
He Gly Val Arg Ser Glu His Lys Leu Ser Thr Asp His He Pro He 
210 215 220 

etc tac aga aca ggc aaa gac aag aaa gga age tgc aat etc tct cgt 
Leu Tyr Arg Thr Gly Lys Asp Lys Lys Gly Ser Cys Asn Leu Ser Arg 
225 230 * 235 240 

9tg gac age aca acc tgc ctt ttc ccg gtg gaa gaa aaa gca gtg gag 
Val Asp Ser Thr Thr Cys Leu Phe Pro Val Glu Glu Lys Ala Val Glu 
245 250 255 

tat tac ttt get tct gat gca agt get gtc ata gaa eac acc aat cgc 
Tyr Tyr Phe Ala Ser Asp Ala Ser Ala Val He Glu His Thr Asn Arg 
260 265 270 

gtc ate ttt ctg gaa gat gat gat gtt gca gca gta gtg gat gga cgt 
Val He Phe Leu Glu Asp Asp Asp Val Ala Ala Val Val Asp Gly Arg 
275 280 285 

ctt tct ate cat cga att aaa cga act gca gga cat cac cat eac cat 
Leu Ser He His Arg He Lys Arg Thr Ala Gly His His His His His 
290 295 300 

cac gat cac ccc gga cga get gtg caa aca etc cag atg gaa etc cag 
His Asp His Pro Gly Arg Ala Val Gin Thr Leu Gin Met Glu Leu Gin 
305 310 315 320 



cag ate atg aag ggc aac ttc agt tea ttt atg cag aag gaa ata ttt 
Gin He Met Lys Gly Asn Phe Ser Ser Phe Met Gin Lys Glu He 4 Phe 
325 330 335 ! 



gag cag cca gag tct gtc gtg aac aca atg aga gga aga gtc aac ttt 
Glu Gin Pro Glu Ser Val Val Asn Thr Met Arg Gly Arg Val Asn Phe 
340 345 350 

gat gac tat act gtg aat ttg ggt ggt ttg aag gat cac ata aag gag 
Asp Asp Tyr Thr Val Asn Leu Gly Gly Leu Lys Asp His He Lys Glu 
355 360 365 

ate cag aga tgc egg cgt ttg att ctt att get tgt gga aca agt tac 
He Gin Arg Cys Arg Arg Leu He Leu He Ala Cys Gly Thr Ser Tyr 
370 375 380 

cat get ggt gta gca aca cgt caa gtt ctt gag gag ctg act gag ttg 
His Ala Gly Val Ala Thr Arg Gin Val Leu Glu Glu Leu Thr Glu Leu 
385 390 395 400 

cct gtg atg gtg gaa eta gca agt gac ttc ctg gac aga aac aca cca 




Pro V.1 Met Val 01U Leu Ma Set A.p Ph. to u Aep Ar g Asn Thr Pro 

410 415 

a 2S S £ 25 SS £ £ a a S £ 2S is ss a ™ 

a s a a a a a g - - s s s J ffi a 

440 445 
act gtg ggg ate aca aac aca crtt aac not- 

Thr VaJ aly m „ ^ «2 £ £ £ *« Jg g. aoj 

" b 450 

25 £ £ S3 S £ £ 82 IS £ S £ IS Sf £ S 

475 480 

a si a a = s a a a a a - s a a a 

495 

a £ a is s a ss s s |« s s ffi s 

505 510 
atg ctt gga ttg aaa egg etc? cct aa^ M-rr «4-«- , 

Met Leu £y Leu L y s g Leu £ £ Leu £ £» £ fa? £ X 

520 525 

S? IS £ US £ a -2 K g £. ctt tat cat ca g aag 
530 eU AXa Thr Glu Le ^ Tyr His Gin Lys 

Wb 540 

a a a a a a a is 55 s 5; a a % a s 

555 560 

1?? a ss si s s» a £ ;s a s? s ss s ^ £ 

570 575 

aa a s ss a £ a a a e ss a is ss ss 

585 590 

a a g £ si £ £ s a is a s a E si a 

600 605 

£ £ £ £ ffl ££ £ £ 25 £ Sf £ £ S? £ 
| £ £ £ S £ £ £ £ £ s - « s s 

635 640 

a si si £ £ a si is a a a a 2 ss s a 

650 655 

a s a a ss ss s s a a a si ss a a £ 

665 670 - 



1344 



1392 



1440 



1488 



1536 



1584 



1632 



1680 



1728 



1776 



1824 



1872 



1920 



1968 



t V0I wopvi 



is !S s s: s si ss as s 5: £ -g s ?s s» * 

680 685 

<210> 8 

<211> 687 

<212> PRT 

<213> Sequence artif icielle 
<220> 

<221> misc_f eature 

<222> (57).. (57) 

<223> Le 'Xaa' en position 57 repr6sente Thr ou lie. 

^223°: GFAT1 .odifi.e par una Etiquette de purification interne 
<400> 8 



Met Cys Gly He Phe Ala Tyr Leu Asn Tyr His Val Pro Arg Thr Arg 

10 15 

Arg Olu lie Leu Glu Thr Leu He Lys Gly Leu Gin Arg Leu Glu Xyr 

25 30 

Arg Gly Tyr Asp Ser Ala Gly y.l Gly Phe Asp Gly Gly Asn Asp Lys 

40 45 

Asp Trp Glu Ala Asn Ala Cys Lvs Xaa m« -n ■ * 

5 0 « U Ile ^ ^ L ys <31y 

60 

£s Val Lys Ala Leu Asp Glu Glu Val His Lys Gin Gin Asp Met Asp 

75 80 

Leu Asp lie Glu Phe Asp Val His Leu Gly He Ala His Thr Arg Trp 

90 95 

Ala Thr His Gly Glu Pro Ser Pro Val Asn Ser His Pro Gin Arg Ser 

105 . 110 

f 

Asp Lys Asn Asn Glu Phe lie Val ti~ * tv~~ m 

115 Asn Gly Ile Ile Thr Asn 

120 125 

Tyr Lys Asp Leu Lys Lys Phe Leu Glu Ser Lys Gly Tyr Asp Phe Glu 

135 140 

Sjr Glu Thr Asp Thr Glu Thr lie Ala Lys Leu Val Lys Tyr Met Tyr 

155 160 

Asp Asn Arg Glu Ser Gin Asp Thr Ser Phe Thr Thr Leu Val Glu Arg 

170 175 

^1 He Gin Gin Leu Glu Gly Ala Phe Ala Leu Val Phe Lys Ser Val 




180 185 190 



Hxs Phe Pro Gly Gin Ala Val Gly Thr Arg Arg Gly Ser Pro Leu Leu 

200 205 

lie Gly val Arg Ser Glu His Lys Leu Ser Thr Asp His lie Pro He 



220 



Leu Tyr Arg Thr Gly Lys Asp Lys Lys Gly Ser Cys Asn Leu Ser Arg 

235 240 

Val Asp Ser Thr Thr Cys Leu Phe Pro Val Glu Glu Lys Ala Val Glu 

250 255 



Tyr Tyr Phe Ala Ser Asp Ala Ser Ala Val He Glu His Thr Asn Arg 

265 270 

Val lie Phe Leu Glu Asp Asp Asp Val Ala Ala Val Val Asp Gly Arg 

280 285 

Leu Ser He His Arg He Lys Arg Thr Ala Gly His His His His His 

255 300 

His Asp His Pro Gly Arg Ala Val Gin Thr Leu Gin Met Glu Leu Gin 

315 320 

Gin lie Met Lys Gly Asn Phe Ser Ser Phe Met Gin Lys Glu Xle Phe 



330 



335 



Glu Gin Pro Glu Ser Val Val Asn Thr Met Arg Gly Arg Val Asn Phe 

345 350 



Asp Asp Tyr Thr Val Asn Leu Gly Gly Leu Lys Asp His He Lys Glu 

360 365 

He Gin Arg Cys Arg Arg Leu He Leu He Ala Cys Gly Thr Ser«' Tyr 

375 380 

His Ala Gly val Ala Thr Arg Gin Val Leu Glu Glu Leu Thr Glu Leu 

395 400 

Pro Val Met Val Glu Leu Ala Ser Asp Phe Leu Asp Arg Asn Thr Pro 

410 • 415 

Val Phe Arg Asp Asp Val Cys Phe Phe Leu Ser Gin Ser Gly Glu Thr 

425 430 

Ala Asp Thr Leu Met Gly Leu Arg Tyr Cys Lys Glu Arg Gly Ala Leu ' 



435 44. n 

440 445 



IOI UCfJUl 



Thr Val Gly n e Thr Asn Thr Val Oly Ser Ser lie Ser Arg Glu Thr 

4b5 460 

Asp Cys Gly Val His lie Asn Ala Gly Pro Glu He Gly Val Ala Ser 



475 



480 



Thr Lys Ala Tyr Thr Ser Gin Phe Val Ser Leu Val Met Phe Ala Leu 

485 a.an 



490 495 



Met Met Cys Asp Asp Arg He Ser Met Gin Glu Arg Arg Lys Glu He 

Met Leu Gly Leu Lys Arg Leu Pro Asp Leu He Lys Glu Val Leu Ser 

520 525 



Met Asp Asp Glu He Gin Lys Leu Ala Thr Glu Leu Tyr His Gin 
" ^ 535 "* * ~~ 



540 



Lys 



Ser val Leu lie Met Gly Arg Gly Tyr His Tyr Ala Thr Cys Leu Glu 

550 "5 560 



Gly Ala Leu Lys lie Lys Glu He Thr Tyr Met His Ser Glu Gly He 
565 570 57 £ 

Leu Ala Gly Glu Leu Lys His Gly Pro Leu Ala Leu Val Asp Lys Leu 

585 590 

Met Pro Val He Met He He Met Arg Asp His Thr Tyr Ala Lys Cys 

600 5Q5 

Gin Asn Ala Leu Gin Gin Val Val Ala Arg Gin Gly Arg Pro Val Val 

615 620 



lie Cys Asp Lys Glu Asp Thr Glu Thr He Lys Asn Thr Lys Arg Thr 

635 . 640 

f 

He Lys val Pro His Ser Val Asp Cys Leu Gin Gly He Leu Ser Val 
645 65 <> 655 

He Pro Leu Gin Leu Leu Ala Phe His Leu Ala Val Leu Arg Gly Tyr 



665 



Asp Val Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 

680 - •• — 



685 



<210> 9 

<211> 2067 

<212> ADW 

<213> Sequence artificielle 




<220> 
<223> 



GFAT2 modifiSe par une Etiquette de purification interne 



<220> 

<221> CDS 

<222> (1) . . (2067) 

<223> 

<400> 9 



S3 8! 1?? £ a is £ 2? si S? IS S3 a s S SI " 

s a s a a a a £ si i?? a a s - a ~ - - 

S 85 S* K S2 S IS S3 a S IS 8? a Si S IS - 

45 



a s a is a a a a ?s a a s a is is a - 

S- £ IS IS IS £ & a IS IS IS S IS £ a S! 

75 80 

IS £ IS a a si is a a a s? a 5 s a a 

90 95 

i?? & So a is is a s a a a a a si a is 

105 110 

SI IS J2 IS S3 £ ffi a IS £ £ £ a a St IS 

120 125 

SI Sf a a 21 IS Sr a IS a IS a is a a a 

is a is s ;s in si a a a a ss a a a is 
is a is is a s a a a a ss a a ss £ a 

170 175 

Sin J2 SS 85 K Phe H S Sf ^ c T aag agt * tc cac "« 

180 6 Lys Ser Val His Pro 

185 190 

is a is is a a ss a is a is a a £ is is 

2 05 

egg age aaa tac aag etc tec aca oaa cao ahr. r*r.*- a f« 4 
Arg jjj Lys ^ ^ Leu Ihr |« JJJ ate « jto tta tac a? g 

^ 1 S 220 
acg tgc act ctg gag aat gtg aag aat ate tgt aag aca egg atg aag 



240 



288 



720 



Thr Cys Th r Leu Glu Asa Val Lys Asn u e C ys Lys ^ Met Lys 

235 240 
a 99 ctg gac age tec gec tgc eta cat art- rn-~ « 

A* 9 L*u ASP S« jjj L. C?e Leu E E S3 Jg g £ ffi *• 

250 255 

E S S E E 2 E S S & E £ S E E E 

s e £ e a a a; § e a ss a S3 e is « 

280 285 

a a g e s & - s B E s s « = 

295 300 

Si S 25 Isp 25 2; ss J2 SS a * c T ttg cag atg gaa ctg 

3 OS 310 9 Ala Ile 61n Thr Leu Gin Met Glu Leu 

315 320 

is se £ e e E e e s a s s a e is £ 

330 335 
ttc gaa cag cca gaa tea att ttc =,^4- 

- «. «. jj» E s« S3 E E £ E SI 8g E S3 K 

345 350 

£ I" E E E S3 E E IS 8g E si - ~ S «. 

360 365 

™" i S S E 25 SS £ £ £ If? 5J I!* s E 

J/a 380 

E E E E S3 E E S IS S3 E SS SS 21 £ SS 

395 400 

E £ S3 S3 f 2 IS E E E E E E E E SS E 

410 415 

E S3 £ E E E SS E S E E S S E SS'SS 

425 430 
ace gcg gac acc etc ctg qca ctcr eor t-*~ 

Thr A!. J. mr ^ « 2 «o gt ajg fJ o eje g? o gt 

440 445 3 * 

E E S3 E S3 E E E S3 85 II? E E E £ IS 

* a5 460 

tgC ggc gtc cac atc aac gca ggcr cca a Sa cr+r, 
J£ Asp cys Gly val ne Abq | ?? ccg gag gtc ggc gtg gec 

475 480 

E E £ E E E E IS E S E E S3 E E SB 



768 



816 



864 



912 



960 



1008 



1056 



1104 



1152 



1200 



1248 



1296 



1344 



1392 



1440 



1488 



490 495 




S2 Me? Sef lit £S ftp S SJ S^r Lei Sin JT ^ *** 1536 

500 f A8n Ar 9 Ar 9 ©In Glu 



505 510 



£ £ 25 85 S S S2 £ a ffi £ S "I IS S3 a 

520 525 
tct ctg gag gag- aag ate cac gac ttg ace cha MO ,,4-„ 

se, Le» 01u olu Lys Ile ^ L P a S a SS a a ffi |g 1632 

535 540 

S s a a fai a a si a? a a a a a $ a - 

555 ' 560 

a a a a a a a a a a a a a a a a 1728 

570 575 

a a a a a a a a a a a a a a a a 1776 

585 590 

a a a a a a a a a a a a a a a a ia - 

600 605 

a a a a a a a a a a a a a ?*= cco att 

610 <-t c la Arg Gln Gl y A *S Pro Ile 

615 620 

a a a a a a a a a a a a a a a a 1320 

635 640 

a a a a a a a a a a a a a a a a - 

650 655 

a a a a a a a a a a a a a a a a 2016 

665 670 

a a a a a a a a a a a a a a a a 



tga 



<210> 10 

<2ll> 688 

<212> PRT 

<213> sequence artificielle 

<220> 
<223> 



GPAT2 modifiee par una etiquette de purification interne 
<400> io 

Met Cys Gly He Phe Ala Tyr Met Asn Tyr Arg Val Pro Ar 3 Thr Arg , 

10 15 



2067 



Lys Qlu lie Phe Glu Thr LeU lie Lys Gly Leu Gin Arg Leu Glu Tyr 

25 30 

Arg Gly Tyr Asp Ser Ala Gly Val Ala He Asp Gly Asn Asn His Glu 
35 40 45 

Val Lys Glu Arg His He Gin Leu Val Lys Lys Arg Gly Lys Val Lys 
au 55 60 

Ala Leu Asp Glu Glu Leu Tyr Lys Gin Asp Ser Met Asp Leu Lys Val 

70 75 80 

Glu Phe Glu Thr His Phe Gly He Ala His Thr Arg Trp Ala Thr His 
85 90 " 95 

Gly Val Pro Ser Ala Val Asn Ser His Pro Gin Arg Ser Asp Lys Gly 

105 X10 

Asn Glu Phe Val Val He His Asn Gly He He Thr Asn Tyr Lys Asp 

120 

Leu Arg Lys Phe Leu Glu Ser Lys Gly Tyr Glu Phe Glu Ser Glu Thr 

135 140 

Asp Thr Glu Thr He Ala Lys Leu He Lys Tyr Val Phe Asp Asn Arg 



155 



Glu Thr Glu Asp He Thr Phe Ser Thr Leu Val Glu Arg Val He 

1$5 



170 



160 



Gin 



175 



Gin Leu Glu Gly Ala Phe Ala Leu Vai Phe Lys Ser Val 



180 



185 



His Tyr Pro 
190 



Gly Glu Ala Val Ala Thr Arg Arg Gly Ser Pro Leu Leu He Gly 
xyb 200 



205 



Val 



Arg ser Lys Tyr Lys Leu Ser Thr Glu Gin He Pro He Leu Tyr Arg 



220 



Thr cys Thr Leu Glu Asn Val Lys Asn He Cys Lys Thr Arg 

23 0 ~ ~ ~* 



235 



Met Lys 
240 



Arg Leu Asp Ser Ser Ala Cys Leu His Ala Val Gly Asp Lys Ala 



250 



Val 



255 



Glu Phe Phe Phe Ala Ser Asp Ala Ser Ala He He Glu His Thr Asn 



265 



270 



Arg val lie Phe Leu Glu Asp Asp Asp He Ala Ala Val Ala Asp Gly 
275 280 285 ' 
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Lys Leu Ser He His Arg Val Lys Arg Ser Ala Ser His His His His 
290 ' 295 300 



His His Asp Asp Pro Ser Arg Ala He Gin Thr Leu Gin Met Glu Leu 
305 310 315 320 

Gin Gin He Met Lys Gly Asn Phe Ser Ala Phe Met Gin Lys Glu He 
325 330 335 

Phe Glu Gin Pro Glu Ser Val Phe Asn Thr Met Arg Gly Arg Val Asn 
340 345 350 

Phe Glu Thr Asn Thr Val Leu Leu Gly Gly Leu Lys Asp His Leu Lys 
355 360 365 

Glu He Arg Arg Cys Arg Arg Leu He Val He Gly Cys Gly Thr Ser 
370 375 380 

Tyr His Ala Ala Val Ala Thr Arg Gin Val Leu Glu Glu Leu Thr Glu 
385 390 395 400 

Leu Pro Val Met Val Glu Leu Ala Ser Asp Phe Leu Asp Arg Asn Thr 
405 410 ^ 415 

Pro Val Phe Arg Asp Asp Val Cys Phe Phe He Ser Gin Ser Gly Glu 
420 425 430 

Thr Ala Asp Thr Leu Leu Ala Leu Arg Tyr Cys Lys Asp Arg Gly Ala 
435 440 445 

Leu Thr Val Gly Val Thr Asn Thr Val Gly Ser Ser lie Ser Arg Glu 
. 450 455 460 

Thr Asp Cys Gly Val His He Asn Ala Gly Pro Glu Val Gly Val Ala 
465 470 475 1 480 

Ser Thr Lys Ala Tyr Thr Ser Gin Phe He Ser Leu Val Met Phe Gly 
485 490 495 

Leu Met Met Ser Glu Asp Arg He Ser Leu Gin Asn Arg Arg Gin Glu 
500 505 510 

He He Arg Gly Leu Arg Ser Leu Pro Glu Leu He Lys Glu Val Leu 
515 520 525 

Ser Leu Glu Glu Lys He His Asp Leu Ala Leu Glu Leu Tyr Thr Gin/ 
530 535 540 : 



Arg Ser Leu Leu Val Met Gly Arg Gly Tyr Asn Tyr Ala thr Cys Leu 

550 555 560 

Glu Gly Ala Leu Lys He Lys Glu He Thr Tyr Met His Ser Glu Gly 

565 570 575 * 

lie Leu Ala Gly Glu Leu Lys His Gly Pro Leu Ala Leu He Asp Lys 

0 565 5 90 

Gin Met Pro Val lie Met Val He Met Lys Asp Pro Cys Phe Ala Lys 
^ 6 °0 605 

Cys Gin Asn Ala Leu Gin Gin Val Thr Ala Arg Gin Gly Arg Pro He 



620 



He Leu Cys Ser Lys Asp Asp Thr Glu Ser Ser Lys Phe Ala Tyr Lys 

630 635 640 

Thr lie Glu Leu Pro His Thr Val Asp Cys Leu Gin Gly He Leu Ser 
645 650 655 

Val He Pro Leu Gin Leu Leu Ser Phe His Leu Ala Val Leu Arg Gly 

665 570 

Tyr Asp Val Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val Glu 
675 680 685 

<210> 11 

<211> 2118 

<212> ADN 

<213> Sequence artif icielle 
<220> 

<223> GFATlAlt modifiee par une etiquette de purification interne 

<220> 

<221> CDS 

<222> (1)..(2118) 

<223> { 
<220> 

< 2 2 1 > mi s c_f e a tur e 

<222> (170) . . (170) 

<223> t OU C 



<400> 11 

atg tgt ggt ata ttt get tac tta 

Met Cys Gly He Phe Ala Tyr Leu 
1 5 

cga gaa ate ctg gag acc eta ate 
Arg Glu He Leu Glu Thr Leu He 
20 

a 9a gga tat gat tct get ggt gtg 
Arg Gly Tyr Asp Ser Ala Gly Val 



aac tac cat gtt cct cga acg aga 
Asn Tyr His Val Pro Arg Thr Ara 
10 is 

aaa ggc ctt cag aga ctg gag tac 

Lys Gly Leu Gin Arg Leu Glu Tyr 

25 30 

gga ttt gat gga ggc aat gat aaa 

Gly Phe Asp Gly Gly Asn Asp Lys 



35 40 45 

gat tgg gaa gcc aat gcc tgc aaa anc cag ctt att aag aag aaa qqa 192 

Asp Trp Glu Ala Asn Ala Cys Lys Xaa Gin Leu lie Lys Lys Lys Gly 
50 55 60 

aaa gtt aag gca cfcg gat gaa gaa gtt cac aag caa caa gat atq aat 

Lys Val Lys Ala Leu Asp Glu Glu Val His Lys Gin Gin Asp Met Asp 

65 70 75 • * 



80 



125 



tac aaa gac ttg aaa aag ttt ttg gaa age aaa ggc tat gac ttc aaa 
Tyr Lys Asp Leu Lys Lys Phe Leu Glu Ser Lys Gly Tyr Isp Phe llu 



140 



tct gaa aca gac aca. gag aca att gcc aag etc gtt aag tat ata tat 
Ser Glu Thr Asp Thr Glu Thr He Ala Lys Leu Val LyI Tyr nil 



1SS 160 



ttZ x »" Sf a agt caa 9at acc aoc tfct act ac <= ttg gtg gag aga 
Asp Asn Arg Glu Ser Gin Asp Thr Ser Phe Thr Thr Leu Val Glu too" 
165 170 " " 3 



175 



gtt ate caa caa ttg gaa ggt get ttt gca ctt gtg ttt aaa aqt att 

vai n e em G m Leu Glu Gly Ala phe Ma Leu | a | phe a J a a g gtt 

180 185 



190 



275 280 



285 



Jsn ri° »u fc T Ct9 9 f a 3&t 9at 9at 9tt gca aca 9ta gtg gab 

Asn Arg Val He Phe Leu Glu Asp Asp Asp Val Ala Ala Val Val Lp 

290 295 300 . 



240 



ttg gat ata gaa ttt gat gta cac ctt gga ata get cat acc cat taa 288 

Leu Asp He Glu Phe Asp Val His Leu Gly He Ala His Thr Arq Trn 

85 90 95 

f? a *.u a f, at gga gaa ccc a 9 fc cct 9tc aat age cac ccc cag cgc tct 336 

Ala Thr His Gly Glu Pro Ser Pro Val Asn Ser His Pro Gin Arc Ser ' 
100 105 HO 

gat aaa aat aat gaa ttt ate gtt att cac aat gga ate ate acc aac 

Asp Lys Asn Asn Glu Phe He Val He His Asn Gly He He Thr Asn 
115 120 ' 



384 



432 



480 



528 



576 



S at »v fc Z CC 399 Caa gca gtt 9gc aca a 99 c 9 a 99t age cct ctq ttq 
His. Phe Pro Gly Gin Ala Val Gly Thr Arg tog Gly sir Pro LeS ill 
195 200 205 

att ggt gta egg agt gaa cat aaa ctt tct act gat cac att cct ata 
He Gly Val Arg Ser Glu His Lys Leu Ser Thr Isp His He Pro Se 
210 215 220 

rt?, l aC aga a £ a 9Ct agg act cag att gg a tea aaa ttc aca egg tqq 
Leu Tyr Arg Thr Ala Arg Thr Gin He Gly Ser Lys Phe Thr tog Tr? 

225 230 235 S 240 

gga tea cag gga gaa aga ggc aaa gac aag aaa gga age tgc aat etc 
Gly Ser Gin Gly Glu Arg Gly Lys Asp LyI Lys Sly sir c?s Stn Leu 
245 250 255 

tit £ 9t 9t ? 9aC agC aca acc tgc ctt ttc cc g gtg gaa gaa aaa gca 
Ser Arg Val Asp Ser Thr Thr Cys Leu Phe Pro Val Glu llu Lys Ala 
260 265 270 

gtg gag tat tac ttt get tct gat gca agt get gtc ata gaa cac acc rsa 
Val Glu Tyr Tyr Phe Ala Ser Asp Ala Ser Ila Val He "IS Ss ?hr 



624 



672 



720 



768 



816 



912 



I CI UG|JUt 



gga cgt ctt tct ate cat cga att aaa cga act gca gga cat cac cat 960 
Gly Arg Leu Ser lie His Arg He Lys Arg Thr Ala Gly Hie His His 
305 310 -315 320 

cac cat cac gat cac ccc gga cga get gtg caa aca etc cag atg gaa 1008 
His His His Asp His Pro Gly Arg Ala Val Gin Thr Leu Gin Met Glu 
325 330 335 

etc cag cag ate atg aag ggc aac ttc agt tea ttt atg cag aaq gaa 1056 
Leu Gin Gin He Met Lys Gly Asn Phe Ser Ser Phe Met Gin Lys Glu 
340 345 350 

Si* f,? 9 ° ag CCa g f g tct gtc 9 fc 9 aac aca at 9 a 9* gga aga gtc 1104 
lie Phe Glu Gin Pro Glu Ser Val Val Asn Thr Met Arg Gly Arg Val 

355 360 365 

aa ° ^ ? at 9aC tat aCt gtg aat ttg ggt S9 fc tfc 9 aa 9 9^ cac ata ' 1152 
Asn Phe Asp Asp Tyr Thr Val Asn Leu Gly Gly Leu Lys Asp His He 

370 375 380 



f" , ~ 3 aei1 - a au d « c ag aaa eta gca aca gaa ctt tat cat 

Leu ser Met Asp Asp Glu He Gin Lys Leu Ala Thr Glu Leu Tyr His 
5 550 555 560 

r* 9 . aa9 ^ Ca gt ^ Ctg ata atg gga cga 39° tat cat fca t get act tgt 
Gin Lys Ser Val Leu He Met Gly Arg Gly Tyr His Tyr Ala Thr Cys 



12 00 



1248 



aag gag ate cag aga tgc egg cgt ttg att ctt att get tgt gga aca 

Lys Glu He Gin Arg Cys Arg Arg Leu He Leu He Ala Cys Gly Thr 

385 3 90 395 400 

agt tac cat get ggt gta gca aca cgt caa gtt ctt gag gag ctg act 

Ser Tyr His Ala Gly Val Ala Thr Arg Gin Val Leu Glu Glu Leu Thr 

4 °5 410 415 

gag ttg cct gtg atg gtg gaa eta gca agt gac ttc ctg gac aga aac 1296 

Glu Leu Pro Val Met Val Glu Leu Ala Ser Asp Phe Leu lsp A?g Sn 

420 425 430 

aca cca gtc ttt cga gat gat gtt tgc ttt ttc ctt agt caa tea ggt 1344 

Thr Pro Val Phe Arg Asp Asp Val Cys Phe Phe Leu sir Gin Ser Sly 

435 440 445 

Hf 9 aca gca gat acfc ttg afc 9 ggt ctt cgt tac tgt aag gag aga gga 1392 
Glu Thr Ala Asp Thr Leu Met Gly Leu Arg Tyr C?s Lyf 111 Arg Gly 

450 455 460 

f? fc ^ ta ff t gt ? ggg atc aca aac aca gtt ggc agt tec ata tea egg 1440 
Ala Leu Thr Val Gly He Thr Asn Thr Val Gly Ser Ser He Ser A?g 

465 470 475 480 

gag aca gat tgt gga gtt cat att aat get ggt cct gag att ggt gtg 1488 
Glu Thr Asp Cys Gly Val His He Asn Ala Gly Pro Glu He Gly ?al 

485 490 49^ 

gee agt aca aag get tat acc age cag ttt gta tec ctt gtg ata ttt 153 fi 

Ala ser Thr Lys Ala Tyr Thr Ser Gin Phe Val Ser Leu Val Me? Pne 

500 505 510 

I?- f^? fi t9 tgt 9at gat Cgg atc tcc atg caa 9aa aga cgc aaa 1584 

Ala Leu Met Met Cys Asp Asp Arg He Ser Met Gin Glu Arg Arg Lys 

515 520 525 

gag atc atg ctt gga ttg aaa egg ctg cct gat ttg att aag gaa gta 1632 

Glu lie Met Leu Gly Leu Lys Arg Leu Pro Asp Leu He Lyf Su 53 

=30 535 540 

S?i S!° S! 9 ? a ! ? a ° H aa a " °f g aaa cta gca aca 9 aa cfc t tat cat 

Ala Thr Glu Leu Tyr His 

555 560 



1680 



1728 



I K51 UC|JUl 



565 570 575 

ctt gaa ggg gca ctg aaa ate aaa gaa att act tat atg cac tct gaa 1776 
Leu Glu Gly Ala Leu Lys lie Lys Glu He Thr Tyr Met His Ser Glu 
580 585 590 

ggc ate ctt get ggt gaa ttg aaa cat ggc cct ctg get ttg gtg gat 1824 
Gly lie Leu Ala Gly Glu Leu Lys His Gly Pro Leu Ala Leu Val Asp 
595 600 605 

aaa ttg atg cct gtg ate atg ate ate atg aga gat cac act tat gee 1872 
Lys Leu Met Pro Val He Met He He Met Arg Asp His Thr Tyr Ala 
610 615 620 

aag tgt cag aat get ctt cag caa gtg gtt get egg cag ggg egg cct' 1920 
Lys Cys Gin Asn Ala Leu Gin Gin Val Val Ala Arg Gin Gly Arg Pro 
625 63 0 635 640 

gtg gta att tgt gat aag gag gat act gag ace att aag aac aca aaa 1968 
Val Val He Cys Asp Lys Glu Asp Thr Glu Thr He Lys Asn Thr Lys 
645 650 655 

aga acg ate aag gtg ccc cac tea gtg gac tgc ttg cag ggc att etc 2016 
Arg Thr He Lys Val Pro His Ser Val Asp Cys Leu Gin Gly He Leu 
660 665 670 

age gtg ate cct tta cag ttg ctg get ttc cac ctt get gtg ctg aga 2064 
Ser Val He Pro Leu Gin Leu Leu Ala Phe His Leu Ala Val Leu Arg 
675 680 685 

ggc tat gat gtt gat ttc cca egg aat ctt gec aaa tct gtg act gta 2112 
Gly Tyr Asp Val Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val 
690 695 700 

9ag tga 2118 ** 

Glu 2118 
705 

<210> 12 
<211> 705 
<212> PRT 

<213> Sequence artificielle 
<220> 

<22l> misc_f eature 
<222> " (57) . . (57) 

<223> Le »Xaa» en position 57 reprisente Thr ou He. f 
<220> 

<223> GFATlAlt modifiSe par une etiquette de purification interne 
<400> 12 

Met Cys Gly He Phe Ala Tyr Leu Asn Tyr His Val Pro Arg Thr Arg 
1 5 10 15 

Arg Glu He Leu Glu Thr Leu He Lys Gly Leu Gin Arg Leu Glu Tyr 
2 0 25 30 

Arg Gly Tyr Asp Ser Ala Gly Val Gly Phe Asp Gly Gly Asn Asp Lysf 
35 40 45 



Asp Trp Glu Ala Asn Ala Cys Lys Xaa Gin Leu lie Lys Lys Lys Gly 
50 55 60 

Lys Val Lys Ala Leu Asp Glu Glu Val His Lys Gin Gin Asp Met Asp 
65 70 75 80 

Leu Asp lie Glu Phe Asp Val His Leu Gly lie Ala His Thr Arg Trp 
85 90 95 

Ala Thr His Gly Glu Pro Ser Pro Val Asn Ser His Pro Gin Arg Ser 
100 105 110 

Asp Lys Asn Asn Glu Phe lie Val He His Asn Gly He He Thr Asn 
115 120 125 

Tyr Lys Asp Leu Lys Lys Phe Leu Glu Ser Lys Gly Tyr Asp Phe Glu 
130 135 140 

Ser Glu Thr Asp Thr Glu Thr He Ala Lys Leu Val Lys Tyr Met Tvr 
14 5 150 155 160 

Asp Asn Arg Glu Ser Gin Asp Thr Ser Phe Thr Thr Leu Val Glu Arg 
165 170 175 

Val He Gin Gin Leu Glu Gly Ala Phe Ala Leu Val Phe Lys Ser Val 
180 185 190 

His Phe Pro Gly Gin Ala Val Gly Thr Arg Arg Gly Ser Pro Leu Leu 
195 200 205 

He Gly Val Arg Ser Glu His Lys Leu Ser Thr Asp His He Pro He 
210 215 220 

Leu Tyr Arg Thr Ala Arg Thr Gin He Gly Ser Lys Phe Thr Arg Trp 
225 230 .235 240 

I 

Gly Ser Gin Gly Glu Arg Gly Lys Asp Lys Lys Gly Ser Cys Asn Leu 
245 250 255 

Ser Arg Val Asp Ser Thr Thr Cys Leu Phe Pro Val Glu Glu Lys Ala 
260 265 270 

Val Glu Tyr Tyr Phe Ala Ser Asp Ala Ser Ala Val He Glu His Thr 
275 280 285 

Asn Arg Val He Phe Leu Glu Asp Asp Asp Val Ala Ala Val Val Asp 
250 295 300 

Gly Arg Leu Ser He His Arg He Lys Arg Thr Ala Gly His His His 
305 ^10 315 520 
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His His His Asp His Pro Gly Arg Ala Val Gin Thr Leu Gin Met Glu 
325 330 335 

Leu Gin Gin lie Met Lys Gly Asn Phe Ser Ser Phe Met Gin Lys Glu 
340 345 350 

He Phe Glu Gin Pro Glu Ser Val Val Asn Thr Met Arg Gly Arg Val 
355 360 3S5 

Asn Phe Asp Asp Tyr Thr Val Asn Leu Gly Gly Leu Lys Asp His lie 
370 375 380 

Lys Glu He Gin Arg Cys Arg Arg Leu He Leu He Ala Cys Gly Thr 
385 390 395 * 400 

Ser Tyr His Ala Gly Val Ala Thr Arg Gin Val Leu Glu Glu Leu Thr 
405 410 415 

Glu Leu Pro Val Met Val Glu Leu Ala Ser Asp Phe Leu Asp Arg Asn 
420 425 430 

Thr Pro Val Phe Arg Asp Asp Val Cys Phe Phe Leu Ser Gin Ser Gly 
435 440 445 * 

Glu Thr Ala Asp' Thr Leu Met Gly Leu Arg Tyr Cys Lys Glu Arg Gly' 
450 455 4 60 M Y 

Ala Leu Thr Val Gly lie Thr Asn Thr Val Gly Ser Ser He Ser Arg 
465 470 475 480 > 

Glu Thr Asp Cys Gly Val His He Asn Ala Gly Pro Glu He Gly Val 
485 490 495 

Ala ser Thr Lys Ala Tyr Thr Ser Gin Phe Val Ser Leu Val Met Phe 
500 505 510 r 

Ala Leu Met Met Cys Asp Asp Arg He Ser Met Gin Glu Arg Arg Lys 
515 520 525 

Glu lie Met Leu Gly Leu Lys Arg Leu Pro Asp Leu He Lys Glu Val 
0 535 540 

Leu Ser Met Asp Asp Glu He Gin Lys Leu Ala Thr Glu Leu Tyr His 

Gin Lys ser Val Leu He Met Gly Arg Gly Tyr His Tyr Ala Thr Cys* 
565 570 575 



Leu Glu Gly Ala Leu Lys lie Lys Glu lie Thr Tyr Met fiis Ser Glu 
580 585 590 

Gly lie Leu Ala Gly Glu Leu Lys His Gly Pro Leu Ala Leu Val Asp 
595 600 605 

Lys Leu Met Pro Val lie Met lie He Met Arg Asp His Thr Tyr Ala 
610 615 620 

Lys Cys Gin Asn Ala Leu Gin Gin Val Val Ala Arg Gin Gly Arg Pro 
625 630 635 ^ 640 

Val Val He Cys Asp Lys Glu Asp Thr Glu Thr He Lys Asn Thr Lys 
^45 650 655 

Arg Thr He Lys Val Pro His Ser Val Asp Cys Leu Gin Gly He Leu 
660 665 670 

Ser Val He Pro Leu Gin Leu Leu Ala Phe His Leu Ala Val Leu Arg 
675 680 685 

Gly Tyr Asp Val Asp Phe Pro Arg Asn Leu Ala Lys Ser Val Thr Val 
690 695 700 

Glu 
705 



<210> 13 

<211> 608 

<212> PRT 

<213> Escherichia coli 

<400> 13 

Cys Gly He Val Gly Ala He Ala Gin Arg Asp Val Ala Glu He Leu 
1 5 10 15 

Leu Glu Gly Leu Arg Arg Leu Glu Tyr Arg Gly Tyr Asp Ser Alk Gly 
20 25 30 

Leu Ala Val Val Asp Ala Glu Gly His Met Thr Arg Leu Arg Arg Leu 
35 40 45 

Gly Lys Val Gin Met Leu Ala Gin Ala Ala Glu Glu His Pro Leu His 
50 55 60 

Gly Gly Thr Gly He Ala His Thr Arg Trp Ala Thr His Gly Glu Pro 
65 70 75 80 

Ser Glu Val Asn Ala His Pro His Val Ser Glu His He Val Val Val 
85 90 95 



His Asn Gly lie lie Glu Asn His Glu Pro Leu Arg Glu Glu Leu Lys 
100 105 " 110 

Ala Arg Gly Tyr Thr Phe Val Ser Glu Thr Asp Thr Glu Val He Ala 
115 120 125 

His Leu Val Asn Trp Glu Leu Lys Gin Gly Gly Thr Leu Arg Glu Ala 
13 0 135 140 



Val Leu Arg Ala He Pro Gin Leu Arg Gly Ala Tyr Gly Thr Val He 
145 15 ° . 155 " iso 

Met Asp Ser Arg His Pro Asp Thr Leu Leu Ala Ala Arg Ser Gly Ser 
165 170 175 

Pro Leu Val He Gly Leu Gly Met Gly Glu Asn Phe He Ala Ser Asp 
180 185 190 

Gin Leu Ala Leu Leu Pro Val Thr Arg Arg Phe He Phe Leu Glu Glu 
195 200 205 

Gly Asp He Ala Glu He Thr Arg Arg Ser Val Asn He Phe Asp Lys 
210 215 220 

Thr Gly Ala Glu Val Lys Arg Gin Asp He Glu Ser Asn Leu Gin Tyr- 
225 230 235 240 

Asp Ala Gly Asp Lys Gly He Tyr Arg His Tyr Met Gin Lys Glu He 
245 250 255 

Tyr Glu Gin Pro Asn Ala He Lys Asn Thr Leu Thr Gly Arg He Ser 
260 265 270 



His Gly Gin .Val Asp Leu Ser Glu Leu Gly Pro Asn Ala Asp Glu Leu 
275 280 285 

f 

Leu Ser Lys Val Glu His He Gin lie Leu Ala Cys Gly Thr Ser Tyr 
290 295 300 

Ash Ser Gly Met Val Ser Arg Tyr Trp Phe Glu Ser Leu Ala Gly He 
305 310 315 320 

Pro Cys Asp Val Glu He Ala Ser Glu Phe Arg Tyr Arg Lys Ser Ala 
325 330 33 5 . 

Val Arg Arg Asn Ser Leu Met He Thr Leu Ser Gin Ser Gly Glu Thr 
340 345 350 ( 

Ala Asp Thr Leu Ala Gly Leu Arg Leu Ser Lys Glu Leu Gly Tyr" Leu 
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355 



360 



365 



Glu 



Gly Ser Leu A!a He Cy. Asn Val Pro Gly Her Ser Le<1 Val 

375 380 a 

Ser Asp Leu Ala Leu Met Thr Asu Ala Gly Thr Glu He Gly Val Ala 

395 400 
ser Thr Lye Ala Ph. Thr Thr olu Leu Thr Val Leu ^ ^ ^ ^ 

410 415 

"a Lye Leu Her Ar 3 Leu Lye Gly Leu Mi 3 „ „. & Hie 

425 430 

He val His Gly Leu Glu Ala Leu Pro Ser Ar 9 He Glu Glu Met Leu 

440 445 
Ser Glu Asp Lys Ar 9 He Glu Ala Leu Ala Glu Asp Phe Ser Aap Lys 

Jis Hi. Ala Leu Phe Leu Gly Ar g Gly Asp Glu Tyr Pre He Ala Leu 

475 480 

Olu Gly Ala Leu Lys Leu Lys Glu He Her Tyr He His Ala Glu Ala 

490 495 

^ Ala Ma Gly Glu Leu Lys H is Gly Pro Leu Aia Leu He Asp Ala 

Asp Met Pro Val He Val Val Ala Pro 
515 520 

-eu Lys Her Asu He Glu Glu Val Ar g Ala Ar g Gly Gly Glu Leu Tyr 

" 5 540 y 

val Phe Ala Asp Gin Asp Ala Gly Phe Val Her Her Asp Asn Met His 

555 560 

He Glu „et Pro Hie Val Glu Glu Val He Ala Pro He Phe Tyr 
Thr Val Pro Leu Gin Leu Leu Ala 



510 



520 ASn G1U Leu Leu Glu L Ys 

525 



575 



580 



Tyr His Val Ala Leu He Lys Gly 



590 



Thr Asp val Asp Glu Pro Ar g Asa Leu Ala Lys Her Val Thr Val Glu 



605 



<210> 14 
<211> 72 
<212> ADN 



ler aepoi 



<213> Sequence artificielle 
<220> 

<223> Amorce 
<400> 14 

tggacgtctt tctatccatc gaattaaacg aactgcagga catcaccatc 
tcaccccgga eg 



<210> 15 
<211> 44 

<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Amorce 

<400> 15 

caaagttgac tcttcctctc attgtgttca cgacagactc tggc 

<210> 16 

<211> 43 

<212> ADN 

<213> Sequence artificielle 
<220> 

<223> Amorce 

<400> 16 

aatctagatt catgetcgag cggccgccag tgtgattgat ate 

<210> 17 

<211> 36 

<212> ADNf 

<213> Sequence artificielle 
<220> 

<223> Amorce 

<400> 17 

atttttatca gagcgctggg ggtggctatt gacagg 

<210> 18 

<211> 8 

<212> PRT 

<213> Sequence artificielle 
<220> 

<223> Etiquette FLAG ■ 



<400> 18 

Asp Thr Lys Asp Asp Asp Asp Lys 
1 5 



<210> 19 

<211> 6 

<212> PRT 

<213> Sequence artificielle 



<220> 

<223> Etiquette hexa-histidine 
<400> 19 

His His His His His His 
1 5 
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